4 разлике између поузданости и валидности (у науци)

Април 5, 2024

Пошто у колоквијалном језику имају веома слична значења, лако је збунити услове поузданости и ваљаности када говоримо о науци и, конкретно, о психометрији.

Са овим текстом намеравамо да разјаснимо велике разлике између поузданости и валидности . Надам се да вам је корисно разјаснити ову уобичајену сумњу.

Повезани чланак: "Психометрија: проучавање људског ума кроз податке"

Шта је поузданост?

У психометрији, концепт "поузданост" односи се на тачност инструмента ; Конкретно, коефицијенти поузданости нас обавештавају о доследности и стабилности мјера које се предузимају са овим алатом.

Што је поузданост инструмента већа, нижа је количина случајних и непредвидивих грешака које ће се појавити приликом коришћења за мерење одређених атрибута. Поузданост искључује предвидљиве грешке, односно оне који су предмет експерименталне контроле.

Према класичној теорији тестова, поузданост је проценат варијансе који се објашњава истинским резултатима. Према томе, директни резултат у тесту би се састојао од сума случајне грешке и истинског резултата.

Две главне компоненте поузданости они су привремена стабилност и унутрашња конзистентност . Први концепт указује на то да се резултати прилично мењају у различитим приликама, док се унутрашња конзистенција односи на степен до којег предмети који чине тест мјеримо исти психолошки конструкт.

Стога, висок коефицијент поузданости указује на то да резултати на тесту мало флуктуирају интерно и као функција времена, и резимирањем тога инструмент је одсутан у грешкама мерења .

Можда вас занима: "Врсте психолошких тестова: њихове функције и карактеристике"

Дефиниција валидности

Када говоримо о ваљаности, говоримо о томе да ли тест правилно мери меру конструкцију коју намерава да мери. Овај концепт је дефинисан као однос између резултата добијеног у тесту и друге сродне мјере ; степен линеарне корелације између оба елемента одређује коефицијент валидности.

Такође, у научним истраживањима висока валидност указује на степен до којег се добијени резултати са датим инструментом или студијом могу генерализовати.

Постоје различите врсте ваљаности, које зависе од начина на који се рачуна; ово чини израз са врло различитим значењима. У суштини можемо разликовати валидност садржаја, критеријум (или емпиријска) валидност и изградња валидности .

Валидност садржаја одређује до које мере предмети психометријског теста представљају репрезентативни узорак елемената који чине конструкт који се оцјењује. Инструмент мора обухватити све основне аспекте конструкције; На пример, ако желимо да направимо адекватан тест за мерење депресије, неопходно је да укључимо ставке које процењују расположење и смањују задовољство.

Валидност критеријума мери способност инструмента да предвиди аспекте везане за особину или подручје од интереса. На крају, намеравана је конструкција утврдити да ли тест мери оно што намјерава мерити , на пример од конвергенције са резултатима добијеним у сличним тестовима.

Разлике између поузданости и валидности

Иако су ова два психометријска својства интимно повезана, истина је да се они односе на јасно диференциране аспекте. Да видимо шта су ове разлике .

1. Циљ анализе

Поузданост је карактеристика инструмента, у смислу да мери особине ставки које га чине. С друге стране, ваљаност се не односи управо на инструмент, већ на на генерализације које су направљене од резултата добијене кроз њега.

2. Информације које пружају

Иако је реч о поједностављеном начину стављања, уопштено говорећи, често се каже да валидност указује на то да психометријски алат заправо мери мјеру конструкције коју намјерава мерити, а поузданост се односи на то да ли га правилно мјери, без грешака.

3. Начин на који се рачунају

За мерење поузданости основно се користе три процедуре: метода две половине, паралелне форме и тест-ретест . Најчешће се користи процедура две половине, у којој се предмети деле на две групе када се одговори на тест; онда се анализира корелација између две половине.

Метода паралелних или алтернативних облика састоји се од стварања два еквивалентна теста за мерење у којој мјери су у корелацији између ставки између њих. Тест-ретест једноставно се заснива на двоструком тесту, под условима што је могуће сличнији.Оба поступка могу се комбинирати, што доводи до тест-ретестирања са паралелним формама, које се састоје од остављања временског интервала између првог облика теста и другог.

Са своје стране, важност израчунава се на различите начине у зависности од типа , али уопштено све методе се заснивају на поређењу резултата у објективном тесту и другим подацима истих субјеката у односу на сличне особине; циљ је да тест може дјеловати као предиктор особине.

Међу методама које се користе за процјену ваљаности налазимо факторијалну анализу и технику мулти-метричких-мулти-траит матрица. Такође, валидност садржаја често одређује рационална, нестатистичка анализа; на пример, она укључује очигледну валидност, која се односи на субјективну процену експерата о валидности теста.

4. Однос између оба концепта

Поузданост психометријског инструмента утиче на њену валидност: Што је поузданија, то је већа његова валидност . Због тога су коефицијенти ваљаности алата увек нижи од вредности поузданости, а ваљаност индиректно информише нас о поузданости.