Исследования крупным планом. Неполная эквивалентность обычной и компьютерной версий батареи тестов общих способностей
Вопрос исследования: Эквивалентны ли печатный и компьютерный варианты батареи тестов общих способностей?
Тип исследования: Лабораторный эксперимент.
Испытуемые: 250 мужчин и 76 женщин в возрасте от 16 до 31 года, поступавших в Королевскую военную академию (Нидерланды).
Независимая переменная: Проведение теста на компьютере или в письменной форме.
Зависимые переменные: Количество вопросов, на которые даны ответы, и доля вопросов, на которые даны правильные ответы.
Общая процедура: Половине испытуемых предлагался компьютерный вариант батареи тестов общих способностей (GABT); другая половина проходила тестирование в обычной письменной форме. Две группы испытуемых были сопоставимы по возрасту, полу и результатам теста общего интеллекта.
Результаты: Испытуемые, которым был предложен компьютерный вариант теста, работали быстрее и ответили на большее количество вопросов. Испытуемые, которым предлагался стандартный вариант теста, ответили на меньшее количество вопросов, но у них была выше доля правильных ответов; этот эффект был сильнее выражен в случае простых тестов.
Вывод: «...эквивалентность компьютерного и печатного вариантов теста должна быть продемонстрирована, а не принята в качестве предположения...».
На основе статьи
F. J. R. Van de Vijver and M. Harsveld, «The Incomplete Equivalence
of the Paper-and-Pencil and Computerized Versions
of the General Aptitude Test Battery»,
Journal of Applied Psychology, 1994, 79, 852-859.
Интерпретация коэффициента надежности
В результате применения любого из описанных трех методов оценки степени надежности теста как измерительного инструмента получается одно число — коэффициент корреляции. Это число, которое обозначают буквой r, может изменяться в пределах от 0 до 1,00, но что это означает? Например, если r = 0,60, означает ли это, что тест имеет приемлемую надежность, или нет?
Большинство психологов согласятся с тем, что приемлемым является коэффициент надежности теста, превышающий 0,80, а наиболее желательны его значения выше 0,90. Мнения по поводу минимального приемлемого значения могут расходиться, поскольку тесты используются с самыми разнообразными целями.
Например, Дреер и Мэй-Дальтон (Dreher amp; Mai-Dalton, 1983) пришли к выводу, что для теста под названием Manifest Needs Questionnaire («Вопросник проявляющихся в поведении потребностей») «минимально значимой» будет оценка внутренней согласованности, равная 0,60.По идеальным стандартам значение r = 0,60 является низким; оно также ниже традиционного нижнего предела для Альфа-оценки Кронбаха внутренней согласованности (Nunnally, 1978). Но Manifest Needs Questionnaire чаще всего используется с исследовательскими целями, и в таком контексте стандарты надежности могут быть более гибкими. Когда результаты теста используются для принятия решений, имеющих важное значение в жизни человека, таких как прием на работу или поступление в колледж, применяются традиционные, более высокие стандарты. Поэтому стандарты оценки коэффициента надежности, как и выбор метода, в какой-то степени зависят от цели исследования.
Соображения, которые следует учитывать при оценке доказательств надежности теста, подробно рассматриваются в учебниках по тестологии. Не имея глубоких знаний по этому вопросу, лучше всего, по-видимому, воспользоваться проверенным эмпирическим правилом «чем выше надежность, тем лучше», поскольку надежность теста непосредственно влияет на стандартную погрешность измерения с помощью данного теста. Эта статистическая характеристика, в свою очередь, важна для практического использования теста.
Еще по теме Исследования крупным планом. Неполная эквивалентность обычной и компьютерной версий батареи тестов общих способностей:
- Исследования крупным планом. Исследование неформальной коммуникативной сети в государственной организации
- Исследования крупным планом. Оптимальное использование тренажеров
- Исследования крупным планом. Модели агрессивного поведения в экспериментально созданном «социальном климате»
- Исследования крупным планом. Влияние гибкого графика работы на уровни абсентеизма и текучести кадров
- Исследования крупным планом. Текучесть кадров, биографические данные и свободная от дискриминации практика приема на работу
- Исследования крупным планом. Точность определения частоты выполнения задания: влияние непосредственного участия и опыта
- Исследования крупным планом. Электронный мониторинг выполнения работы и социальный контекст: влияние на производительность и стресс
- Исследования крупным планом. Определение времени реакции для четырех вариантов взаимного расположения органа управления и дисплея
- Исследования крупным планом. Играет ли роль опосредование передачи информации? Влияние вида задания и технических средств на выполнение задания группой и реакции ее членов
- Дружинин В. Н.. Психология общих способностей, 2007
- Пример 3.1 ТЕСТ ОБЩИХ ТЕХНИЧЕСКИХ СПОСОБНОСТЕЙ
- Глава IV ДИАГНОСТИКА УМСТВЕННОГО РАЗВИТИЯ И ОБЩИХ СПОСОБНОСТЕЙ
- Проблемы исследования валидности тестов
- Теперь - немного общих сведений об исследовании: организации, тематике, методах.
- «Виртуальная реальность», или Педагогические возможности игровой эстетической компьютерной среды в курсе «Компьютерная графика и анимация» Елена ХРАМЦОВА
- Раздел I, в котором описаны в общих чертах пороки системы правосудия и рассмотрен, в частности, вопрос о том, способно ли упразднение продажности и наследования должностей стать действенным средством для излечения подобных недугов
- Темы рефератов, ориентированные на исследование и анализ методологических идей и концепций крупнейших представителей современно \ философии и естествознания
- 5.2. 1. Экспериментальные исследования сорбционной способности каолинита
- 6.1.1. Основные подходы к исследованию управленческих способностей и стилей руководства