Требование надежности - прежде всего требование внутренней согласованности частей методики и воспроизводимости результатов при повторном исследовании. "Надежность свидетельствует о свойстве метода приводить к одним и тем же результатам при использовании этого метода разными людьми или при повторном применении данного метода одним и тем же человеком с целью оценивания одного и того же психологического свойства".
О высокой надежности метода говорят в том случае, когда метод точно измеряет то свойство, для измерения которого он предназначен. В качестве критериев точности можно отметить следующие:
1) При повторном применении метода к тем же самым испытуемым в одних и тех же условиях через определенный интервал времени результаты обоих тестирований существенно не различаются между собой.
2) Действия случайных посторонних факторов не оказывают существенного влияния на результаты тестирования.
В качестве посторонних факторов можно назвать следующие: эмоциональное состояние и утомление, если они не входят в круг исследуемых характеристик, температура, освещенность помещения и др. Такие посторонние случайные факторы еще называют факторами нестабильности измерительной процедуры.
3) При повторном применении метода к тем же самым испытуемым через определенный интервал времени в измененных условиях результаты обоих тестирований существенно не различаются между собой. Под измененными имеется в виду следующие условия: другой экспериментатор, состояние респондента и др.
Существуют различные методы оценки надежности:
Ретестовый метод - повторное тестирование выборки испытуемых одним и тем же тестом через определенный интервал времени при одних и тех же условиях. Временной интервал зависит от возраста (например, у маленьких детей изменения могут произойти в течение одного месяца), а также событий, происходящих с испытуемым в жизни.
За индекс надежности принимается коэффициент корреляции между результатами двух тестирований. Полученная высокая корреляция может быть результатом тренированности испытуемого на заданиях подобного типа; низкая корреляция может быть результатом происшедших изменений с испытуемым, а также может свидетельствовать о ненадежности теста.
Надежность взаимозаменяемых форм - повторное тестирование выборки испытуемых параллельной формой теста через минимальный интервал времени при одних и тех же условиях.
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя параллельными формами теста. Высокий коэффициент корреляции и большой интервал между двумя испытаниями свидетельствуют о высокой надежности теста.
Возможный обман со стороны испытуемого, его искушенность, события, происшедшие в интервале между тестированиями, не оказывают особого влияния (как в ретестовом методе) на степень надежности теста. Если фактор тренировки снижен при тестировании параллельными формами, то эффект переноса принципа заданий часто имеет место. Эффект переноса следует учитывать при построении параллельных форм.
Требования к построению параллельных форм:
1. параллельные формы должны быть независимо построенными тестами, но отвечать одним и тем же требованиям;
2. должны содержать одинаковое количество заданий со сходной степенью трудности;
3. эквивалентность параллельных форм необходимо проверять ретестовым методом.
Метод расщепления состоит в том, что тест разбивают на две сопоставимые части. Респондент выполняет задания этих двух частей в течение одного сеанса с получением двух результатов (например, тест Равена содержит две части: четные и нечетные задания).
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя этими частями. Он называется коэффициентом внутренней согласованности теста.
Валидность и надежность. Тест может быть надежен, но не валиден. Это означает, что он измеряет какое-то свойство очень точно, но какое именно - остается под вопросом. В такой ситуации необходима более точная валидизация теста, как содержательная, так и практическая.Дискриминативность
Дискриминативность - это способность отдельных заданий теста и теста в целом дифференцировать обследуемых относительно ''максимального" и "минимального" результатов теста. Дискриминативность измеряется показателем дельта Фергюсона и принимает максимальное значение при равномерном (прямоугольном) распределении показателей (d=1).
Читайте также:
Научно-исторический портрет Павлова
Выдающийся физиолог Иван Петрович Павлов создал новое направление в физиологии, характеризуемое как «синтетическая физиология» - изучение жизненных процессов в целостном организме при его разнообразных взаимоотношениях с окружающей средой ...
Феноменология малых групп
Малая группа – совокупность людей, взаимодействующих друг с другом определенным образом и осознающих свою принадлежность к данной группе. Эти люди считаются членами группы с точки зрения других членов этой группы. При этом каждый человек ...
Гениальность
«Гениальность - это высшая степень, какой может достигать человеческая способность. В мысли, рожденной вдохновением гения, есть что-то непомерное, экстраординарное - этим и отличаются его творения. Но когда он не одержим вдохновением, он ...