<<
>>

Исследования крупным планом. Неполная эквивалентность обычной и компьютерной версий батареи тестов общих способностей

Вопрос исследования: Эквивалентны ли печатный и компьютерный варианты батареи тестов общих способностей?

Тип исследования: Лабораторный эксперимент.

Испытуемые: 250 мужчин и 76 женщин в возрасте от 16 до 31 года, поступавших в Королевскую военную академию (Нидерланды).

Независимая переменная: Проведение теста на компьютере или в письменной форме.

Зависимые переменные: Количество вопросов, на которые даны ответы, и доля вопросов, на которые даны правильные ответы.

Общая процедура: Половине испытуемых предлагался компьютерный вариант батареи тестов общих способностей (GABT); другая половина проходила тестирование в обычной письменной форме. Две группы испытуемых были сопоставимы по возрасту, полу и результатам теста общего интеллекта.

Результаты: Испытуемые, которым был предложен компьютерный вариант теста, работали быстрее и ответили на большее количество вопросов. Испытуемые, которым предлагался стандартный вариант теста, ответили на меньшее количество вопросов, но у них была выше доля правильных ответов; этот эффект был сильнее выражен в случае простых тестов.

Вывод: «...эквивалентность компьютерного и печатного вариантов теста должна быть продемонстрирована, а не принята в качестве предположения...».

На основе статьи

F. J. R. Van de Vijver and M. Harsveld, «The Incomplete Equivalence

of the Paper-and-Pencil and Computerized Versions

of the General Aptitude Test Battery»,

Journal of Applied Psychology, 1994, 79, 852-859.

Интерпретация коэффициента надежности

В результате применения любого из описанных трех методов оценки степени надежности теста как измерительного инструмента получается одно число — коэффициент корреляции. Это число, которое обозначают буквой r, может изменяться в пределах от 0 до 1,00, но что это означает? Например, если r = 0,60, означает ли это, что тест имеет приемлемую надежность, или нет?

Большинство психологов согласятся с тем, что приемлемым является коэффициент надежности теста, превышающий 0,80, а наиболее желательны его значения выше 0,90. Мнения по поводу минимального приемлемого значения могут расходиться, поскольку тесты используются с самыми разнообразными целями.

Например, Дреер и Мэй-Дальтон (Dreher amp; Mai-Dalton, 1983) пришли к выводу, что для теста под названием Manifest Needs Questionnaire («Вопросник проявляющихся в поведении потребностей») «минимально значимой» будет оценка внутренней согласованности, равная 0,60.

По идеальным стандартам значение r = 0,60 является низким; оно также ниже традиционного нижнего предела для Альфа-оценки Кронбаха внутренней согласованности (Nunnally, 1978). Но Manifest Needs Questionnaire чаще всего используется с исследовательскими целями, и в таком контексте стандарты надежности могут быть более гибкими. Когда результаты теста используются для принятия решений, имеющих важное значение в жизни человека, таких как прием на работу или поступление в колледж, применяются традиционные, более высокие стандарты. Поэтому стандарты оценки коэффициента надежности, как и выбор метода, в какой-то степени зависят от цели исследования.

Соображения, которые следует учитывать при оценке доказательств надежности теста, подробно рассматриваются в учебниках по тестологии. Не имея глубоких знаний по этому вопросу, лучше всего, по-видимому, воспользоваться проверенным эмпирическим правилом «чем выше надежность, тем лучше», поскольку надежность теста непосредственно влияет на стандартную погрешность измерения с помощью данного теста. Эта статистическая характеристика, в свою очередь, важна для практического использования теста.

<< | >>
Источник: Джуэлл Л.. Индустриально-организационная психология. Учебник для вузов — СПб.: Питер. — 720 с.: ил. — (Серия «Учебник нового века»). 2001

Еще по теме Исследования крупным планом. Неполная эквивалентность обычной и компьютерной версий батареи тестов общих способностей:

  1. Исследования крупным планом. Исследование неформальной коммуникативной сети в государственной организации
  2. Исследования крупным планом. Оптимальное использование тренажеров
  3. Исследования крупным планом. Модели агрессивного поведения в экспериментально созданном «социальном климате»
  4. Исследования крупным планом. Влияние гибкого графика работы на уровни абсентеизма и текучести кадров
  5. Исследования крупным планом. Текучесть кадров, биографические данные и свободная от дискриминации практика приема на работу
  6. Исследования крупным планом. Точность определения частоты выполнения задания: влияние непосредственного участия и опыта
  7. Исследования крупным планом. Электронный мониторинг выполнения работы и социальный контекст: влияние на производительность и стресс
  8. Исследования крупным планом. Определение времени реакции для четырех вариантов взаимного расположения органа управления и дисплея
  9. Исследования крупным планом. Играет ли роль опосредование передачи информации? Влияние вида задания и технических средств на выполнение задания группой и реакции ее членов
  10. Дружинин В. Н.. Психология общих способностей, 2007
  11. Пример 3.1 ТЕСТ ОБЩИХ ТЕХНИЧЕСКИХ СПОСОБНОСТЕЙ
  12. Глава IV ДИАГНОСТИКА УМСТВЕННОГО РАЗВИТИЯ И ОБЩИХ СПОСОБНОСТЕЙ
  13. Проблемы исследования валидности тестов
  14. Теперь - немного общих сведений об исследовании: организации, тематике, методах.
  15. «Виртуальная реальность», или Педагогические возможности игровой эстетической компьютерной среды в курсе «Компьютерная графика и анимация» Елена ХРАМЦОВА
  16. Раздел I, в котором описаны в общих чертах пороки системы правосудия и рассмотрен, в частности, вопрос о том, способно ли упразднение продажности и наследования должностей стать действенным средством для излечения подобных недугов
  17. Темы рефератов, ориентированные на исследование и анализ методологических идей и концепций крупнейших представителей современно \ философии и естествознания
  18. 5.2. 1. Экспериментальные исследования сорбционной способности каолинита
  19. 6.1.1. Основные подходы к исследованию управленческих способностей и стилей руководства