Клайн Пол

используется также в личностных тестах
как предложение выбрать вариант, наиболее приемлемый для испы-
туемого.
- с вынужденным выбором (forced-choice items) - форма зада-
ний опросников, в которых испытуемые должны выбрать то утверж-
дение (обычно из двух), которое наиболее соответствует их представ-
лению о себе и (или) явлениях действительности.
- с ограничениями на ответы (limited-response items, restric-
ted-response items) - форма заданий, в которых испытуемые должны
давать ответы, возможности формулирования которых соотвествую-
щим образом ограничены.
- со свободным (произвольным) ответом (free-response items)
- форма заданий, в которых на ответы не накладываются никакие
ограничения, однако при корректной формулировке заданий предпо-
лагается наличие только одного правильного ответа.
- с ответами типа "нравится-не нравится" (like-dislike items)
- форма заданий опросников, в которых испытуемые должны ука-
зать, нравится им предложенное или нет.
- с рейтинговыми шкалами (items with rating scales) - форма
заданий опросников, в которых испытуемым для оценки предъявляе-
мых утверждений прилагаются рейтинговые шкалы.
- типа "встретил лишнее - убери" (odd-man-out) - форма
заданий тестов интеллекта, в которой испытуемый должен выявить
общую закономерность для списка элементов и устранить лишний
для этой закономерности элемент.
-трихотомические (trichotomous items) -задания, предуматри-
вающие три варианта ответов: "да-?-нет", "да-затрудняюсь от-
ветить-нет", "обычно-иногда-никогда", "согласен-не уверен-
ие согласен" и пр.
ШБЛЮТБКА
anV
ef65
теста область заданий (domain) - множество заданий, матери-
ал, подбираемый исследователем и являющийся исходным для фор-
мирования теста (стат.)
теста область применения (domain) - характеристика методи-
ки, указывающая на особенности контингента испытуемых, для ко-
торых предназначен тест (стат.)
теста однородность (test homogeneity) - характеристика теста,
отражающая степень соответствия всех заданий измеряемой черте
или свойству; определяется как средняя корреляция между задания-
ми теста.
теста трудность заданий (difficulty) - характеристика заданий
теста, отражающая статистический уровень их выполнения в данной
выборке стандартизации.
угадывание ответов (guessing) - проблема в конструировании
тестов интеллекта, специальных способностей и достижений, состо-
ящая в возможности случайного угадывания испытуемыми правиль-
ных ответов, искажающего их показатели по тесту.
установки на ответ (response sets) - стереотипы ответов на
задания теста, ведущие к нарушению валидности; наиболее распро-
страненные - установка на согласие и установка на социально одоб-
ряемые ответы; наибольшее значение имеют для личностных тестов
(опросников).
- на крайние ответы (response set of using the extreme response)
- тенденция испытуемого выбирать крайние ответы шкалы.
- на неопределенные или средние ответы (response set of using
the uncertain or middle cathegory) - склонность испытуемого прибе-
гать к средней или неопределенной категории ответов как к безопас-
ному компромиссу.
- на согласие (response set of acquiescence) - тенденция испы-
туемого соглашаться с утверждениями (вопросами) теста независимо
от их содержания.
- на социально одобряемые ответы (response set of social de-
sirability) - тенденция испытуемого отвечать на вопросы так, чтобы
выглядеть "социально положительным".
фактор - измерение, конструкт или вектор, который может ма-
тематически отражать ковариацию между переменными (факто-
рный анализ).
- генеральный (general factor) - фактор, соответствующий всем
элементам данного множества переменных, то есть имеющий нагруз-
ки по всем переменым. Применительно к тестам интеллекта обычно
выделяют:
1
- - фактор "g (general factor) - фактор, определяющий поло-
жительные корреляции между любыми тестами интеллекта. Из него
выделены:
--фактор "gf текучие способности (fluid abilities) -способ-
ность отыскивать связи и выявлять отношения, зависимости на ма-
териале, который, как предполагается, минимизирует индивидуаль-
ные различия в образовании и культурном уровне.
- - фактор "gc" кристаллизованные способности (crystallized
abilities) - результат обучения и опыта, изменяются в зависимости
от культуры, к которой принадлежит человек, активности, интересов
личности.
- групповой (group factor) - фактор, определяющий положи-
тельные корреляции ограниченных групп тестов, но не являющийся
универсальным, подобно фактору "g" для тестов интеллекта; имеет
нагрузки на группу переменных из общего множества переменных.
- зависимые (облические) (oblique factors) - коррелирующие
факторы; при векторном представлении факторные оси стоят под
острыми углами друг к другу.
- общий (common factor) - фактор, соответствующий по край-
ней мере двум элементам данного множества переменных.
-ортогональные (orthogonal factors) -не коррелирующие меж-
ду собой факторы.
- специфический (specific factor) - фактор, соответствующий
лишь одному элементу данного множества переменных.
факторов вращение (factor rotation) - при векторном представ-
лении факторов возможно вращение одного фактора относительно
другого; при этом значения факторных нагрузок (представляющих
собой проекции вращаемого вектора на оси координат, образуемые
другими факторами) изменяются, но в целом они математически
эквивалентны, так что существует бесконечное количество эквива-
лентных факторно-аналитических решений (стат.).
- факторов облическое (косоугольное) вращение (oblique rota-
tion) - при таком вращении векторов или факторов, находящихся в
косоугольном положении (то есть угол между ними менее 90 граду-
сов) , факторы коррелируют, а значение их корреляции равно коси-
нусу угла между ними (стат.).
- факторов ортогональное вращение (orthogonal rotation) -
при ортогональном вращении факторов сохраняются прямые углы
между векторами, и значение их взаимной корреляции равно нулю
(стат.).
19
факторные нагрузки (factor loadings) - значения корреляции
факторов с переменными; фактор может быть определен по его фак-
торным нагрузкам (стат.).
факторный анализ (factor analysis) - раздел многомерного ста-
тистического анализа, объединяющий математико-статистические
методы снижения размерности изучаемого многомерного признака.
В исследованиях Р.Кэттелла и его последователей факторный анализ
выступает не только в качестве статистического метода, но и как
инструмент познания личности.
Холли методика (НоНеу) - методика вычисления показателей
проективных тестов, заключающаяся в содержательном анализе
протоколов тестирования и оценкой 0 или 1 отсутствия или наличия
тех или иных особенностей.
черта (trait) - измерямая при помощи психодиагностической
методики особенность испытуемого.
- скрытая черта (latent trait) - внутренняя, скрытая особен-
ность исследуемого объекта или явления, выявляемая на основе ее
внешних проявлений.
шкала - форма фиксации совокупности признаков изучаемого
объекта с упорядочением их в определенную числовую систему.
- Гутмена (Guttman scales) - тип шкал для тестов способностей,
достижений, интеллекта и аттитюдов, в которых предполагается, что
задания упорядочены по трудности, а их выполнение испытуемыми
описывается кривыми зависимости "задание-ответ".
- интервалов (interval scale) - континуальная шкала без фикси-
рованной нулевой точки (точки отсчета), с равномерным разбиением
измеряемого интервала делениями шкалы.
- Лайкерта (Likert scales) - тип шкал для тестов аттитюдов,
состоящих из утверждений с 5- или 7-балльными шкалами, указыва-
ющими степень согласия испытуемого с этими утверждениями; пред-
полагается также, что отдельные задания монотонно связаны с изме-
ряемым аттитюдом.
- наименований (номинативная) (nominal scale) - простейшая
классификация, устанавливающая соответствие признака тому или
иному классу.
- лжи (lie scale) - шкала для тестов личности (опросников),
состоящая из вопросов, касающихся незначительных проступков,
которые совершаются большинством людей; используется для выяв-
ления лиц, склонных к социально одобряемым ответам.
- отношений (ratio scale) - континуальная шкала с равномерно
нанесенными делениями и со значимой нулевой точкой.
20
- порядковая (ранговая) (ordinal scale) - элементы шкалы упо-
рядочены (ранжированы), но в этой шкале не учитываются расстоя-
ния между ними.
-сбалансированная (balanced scale) -шкала для тестов личнос-
ти (опросников), в которой примерно равное количество заданий
имеют ключевые ответы "да" или "нет"; используется как один из
способов минимизации влияния установки на согласие.
- Терстоуна (Thurstone scale)- тип шкалы для тестов аттитю-
дов, по которой ответы испытуемого оцениваются относительно 11-
балльной шкалы с равномерно распределенными по ней заданиями
(утверждениями относительно данного аттитюда), оцененными
предварительно экспертами.
шкалирование по Рашу (Rasch scaling) - метод шкалирования
заданий, разработанный Рашем, в котором предполагается, что ве-
роятность правильного ответа определяется двумя параметрами: сте-
пенью, в которой задание выявляет скрытую черту, и выраженно-
стью у испытуемого этой черты. Эти параметры могут оцениваться
независимо.
элементарные когнитивные задачи (elementary cognitive tasks -
ECTs) - экспериментальные задачи, рассматриваемые как индика-
торы психических процессов, разработанные в рамках когнитивного
подхода к изучению способностей, для метода прогнозирования эф-
фективности (успешности) деятельности по факторам успешности
выполнения этих задач.
Q -анализ - факторно-аналитическая методика, в которой в ка-
честве переменных представлены испытуемые, а не тесты или изме-
ряемые свойства (стат.).
21
Глава 1. Характеристики эффективных
психологических тестов
Психологический тест может быть охарактеризован как эффек-
тивный при условии, что он удовлетворяет определенным требовани-
ям. Основные требования следующие:
1) использование шкалы интервалов;
2) надежность;
3) валидность;
4) дискриминативность;
5) наличие нормативных данинх или возможность описания с
высокой точностью моделью Раша и ей подобными, а в случае инди-
видуально-ориентированных тестов - наличие критериев, установ-
ленных экспертами.
В этом руководстве я намерен продемонстрировать, как эти тре-
бования могут быть учтены в тестах при их обосновании, а также в
процессе конструирования. Однако, прежде чем это будет сделано,
необходимо обсудить и определить все те термины, в которых следует
досконально разобраться, если вы хотите, чтобы тесты были не толь-
ко правильно сконструированы, но и соответствующим образом ис-
пользовались.
Всегда следует помнить о том, что все требования, предъявляемые
к психологическим тестам, не случайны, а связаны с улучшением
точности измерений. Точные измерения - это обязательное условие
научности. Прогресс в естественных науках зависел от разработки
эффективной системы измерений и, с моей точки зрения, психология
не является исключением из этого правила. Короче говоря, каждое
из требований, описываемых ниже, вносит свой вклад в эффектив-
ность психометрии.
Типы шкал
Существуют шкалы нескольких уровней, иерархически упорядо-
ченных по сложности. Это следующие уровни, начиная с простейше-
го:
(1) Номинативные шкалы (шкалы наименований). Это простей-
шая классификация испытуемых: мужчина/женщина - классифи-
кация по номинативной шкале.
(2) Порядковые шкалы. Здесь субъекты ранжированы, например,
по весу или росту. Такая шкала очевидно груба, поскольку не учиты-
вает значения разностей между рангами.
(3) Шкалы интервалов. В них разности между значениями во
всех точках данной шкалы равны. Эквивалентные интервальные
22
шкалы могут быть линейно преобразованы друг в друга, что позволя-
ет приводить результаты тестирования к общим шкалам и таким
образом осуществлять сравнение показателей. Более того, многие
статистические процедуры предполагают измерения по шкале интер-
валов.
(4) Шкалы отношений. Шкалы отношений помимо всего имеют
значимую нулевую точку (в отличие от интервальной шкалы она не
произвольна, а указывает на полное отсутствие измеряемого свойст-
ва) . Наличие такой точки - проблема для большинства психологи-
ческих переменных, хотя существуют методы конструирования тес-
тов, позволяющие использовать эту возможность.
По рассмотрении перечисленных четырех шкал становится оче-
видным, что в идеале разработчик психологических тестов должен
стремиться использовать шкалы отношений. В случае, когда это не-
возможно, то желательны шкалы интервалов, если предполагается,
что результаты будут подвергаться статистическому анализу. По-
скольку изучение валидности тестов практически неизбежно влечет
за собой такой анализ (а также потому, что количественные показа-
тели измерений в психологических тестах предоставляют им преиму-
щества по сравнению с другими видами испытаний), вывод очевиден:
ничего менее точного, чем шкалы интервалов, использовать нельзя.
Фактически же, как указывает Brown (1976), большинство психо-
метрических тестов приближаются к интервальным шкалам, а обра-
ботка результатов тестов так, как если бы они основывались на шка-
лах интервалов, дает полезные результаты.
Надежность
В психометрии термин "надежность" имеет два значения. Тест
называется надежным, если он является внутренне согласованным
(self-consistent). Тесттакженазываетсянадежным, еслиондаетодни
и те же показатели для каждого испытуемого (при условии, что
испытуемый не изменился) при повторном тестировании. Надеж-
ность при повторном тестировании по прошествии времени называ-
ется ретестовой надежностью (test-retest reliability).
Значение и важность надежности
по внутренней согласованности
В психометрии стремятся разрабатывать тесты, являющиеся в
высокой степени внутренне согласованными, по той очевидной при-
чине, что если некоторая переменная измеряется частью теста, то
тогда в других частях, если они не согласованы с первой, эта же
переменная измеряться не может. Таким образом оказывается, что
23
для того, чтобы тест был валидным (то есть измерял именно то, для
измерения чего он предназначен), он должен быть согласованным:
общепринятая в психометрии точка зрения состоит именно в том, что
высокая надежность является предпосылкой валидности (напр.,
Guilford, 1956; Nunnally, 1978).
Единственным, кто подвергает это положение сомнению, являет-
ся Кэттелл (см.напр. Cattell и Kline, 1977). Он аргументирует свою
точку зрения тем, что высокая внутренняя согласованность в дейст-
вительности является противоположностью валидности на том осно-
вании, что каждый вопрос должен затрагивать меньшую область или
иметь более узкое значение, чем критерий, подвергающийся измере-
нию. Таким образом, если все вопросы в высокой степени согласова-
ны, они значимо коррелируют, и, следовательно, надежный тест
будет измерять только лишь сравнительно "узкую" переменную с
малыми отклонениями. В качестве поддержки такой точки зрения
можно заметить следующее: (1) действительно, коэффициент а.
Кронбаха возрастает при увеличении интеркорреляции заданий; и
(2) при прогностическом изучении любой области со многими пере-
менными максимальное значение величины множественной корре-
ляции между тестами и критерием (в данном случае между задания-
ми теста и общим результатом) может быть получено, когда перемен-
ные между собой не коррелируют. Это очевидно, поскольку если две
переменные весьма значимо коррелируют, то одна из них не будет
предоставлять никакой новой информации.
Таким образом, максимум валидности, по рассуждениям Кэттел-
ла, может быть получен тогда, когда все задания теста не коррелиру-
ют друг с другом, а каждое из них имеет положительную корреляцию
с критерием. Однако, такой тест будет характеризоваться низкой
надежностью по внутренней согласованности. С моей точки зрения,
теоретически Кэттелл прав. Однако, насколько мне известно, ни
одному разработчику тестов не удалось сформулировать такие зада-
ния, которые, коррелируя с критерием, не коррелировали бы между
собой. Barrett и Kline (1982) исследовали личностный тест самого
Кэттелла (16 PF), в котором была сделана такая попытка, но оказа-
лось, что она не была полностью удачна.
Несмотря на эти комментарии, общее психометрическое правило
гласит: на практике валидные тесты являются в высокой степени
согласованными.
Ретестовая надежность (test-retest reliability)
Когда тест не может дать тот же самый результат для некоторого
испытуемого (при условии, что этот испытуемый не изменился) в
24
различных условиях, - значит, не все в порядке. Способ измерения
ретестовой надежности очень прост.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

А-П

П-Я

Введение в психометрическое проектирование