Новые технологии в тестировании. критериально-ориентированное тестирование (корт). Тесты достижений и критериально-ориентированное тестирование Кто является разработчиком критериально ориентированного тестирования

Отличаются от традиционных тестов тем, что в традиционных оценка осуществляется путем соотнесения индивидуальных результатов с групповыми (ориентация на статистическую норму), а в критериально-ориентированных – оценка осуществляется путем соотнесения индивидуальных результатов с некоторым критерием. В качестве такого критерия выступает уровень владения навыком, умениями, знаниями.

КОТ используются в образовании. Цель тестирования с помощью КОТ – оценка владения навыком. Итоговый показатель фиксирует степень владения навыком и не включает в себя индивидуальные различия, что является слабым местом КОТ. Поэтому их использование возможно для оценки элементарных навыков.

Отечественным примером КОТ является Школьный Тест Умственного Развития – ШТУР (1).

Критериально-ориентированные тесты – тип тестов, предназначенных для определения уровня индивидуальных достижений относительно некоторого критерия на основе логико-функционального анализа содержания заданий. В качестве критерия (или объективного эталона) обычно рассматриваются конкретные знания, умения, навыки, необходимые для успешного выполнения той или иной задачи. Это основное отличие критериально-ориентированных тестов от традиционных психометрических тестов, оценка в которых осуществляется на основе соотнесения индивидуальных результатов с групповыми (ориентация на статистическую норму). Термин «критериально-ориентированные тесты» предложен Р. Гласером в 1963 г. Установление содержательного и структурного соответствия заданий теста и реальной задачи – важнейший этап разработки критериально-ориентированных тестов. Этим целям служит так называемая спецификация, включающая:

б) систематизацию знаний, умений и навыков, обеспечивающих выполнение критериальной задачи;

в) образцы тестовых заданий и описание стратегии их конструирования.

Различают две разновидности критериально-ориентированных тестов:

1) тесты, задания которых гомогенны, т. е. сконструированы на одной или аналогичной содержательной и логической основе. Обычно такого рода критериально-ориентированные тесты разрабатываются на материале учебных программ и используются для контроля за формированием соответствующих знаний, умений и навыков;

2) тесты, задания которых гетерогенны и заметно отличаются по логической структуре. В этом случае обычна ступенчатая структура теста, при которой каждая ступень характеризуется собственным уровнем сложности, определяемым логико-функциональным анализом содержания, относящегося к критериальной области поведения. А. Анастази (1982) считает, что акцент критериально-ориентированных тестов на содержательном смысле интерпретации тестовых показателей может оказать благотворное влияние на тестирование в целом. В частности, описание результатов, полученных с помощью тестов интеллекта, в терминах специфических навыков и умений в значительной мере обогащает фиксируемые ими показатели. Для критериально-ориентированных тестов непригодны в большинстве случаев обычные приемы определения валидности и надежности.

Исходя из социально-психологического норматива анализируются результаты, полученные с помощью известных психометрических тестов.

Билет №26 Тесты достижений.

Тест достижений – это группа психодиагностических методик, направленных на оценку достигаемого уровня развития навыков и знаний.

2 группы тестов достижений:

1. Тесты успешности обучения (используются в системе образования)

2. Тесты профессиональных достижений (тесты диагностики специальных знаний и трудовых навыков, необходимых для выполнения профессионально-трудовых действий).

Тест достижения противоположен тесту способностей. Различия: между этими тестами существует различие в степени единообразия предшествующего опыта, который и диагностируется. Если тест способностей отражает влияние совокупного разнообразного опыта, получаемого учащимися, то тест достижений отражает влияние относительно стандартного курса обучения чему-то.

Цель применения тестов способностей и тестов достижений:

· тесты способностей – для предсказания различия успешности выполнения деятельности

· тесты достижений – делают конечную оценку знаний и навыков по завершении обучения.

Ни тесты способностей, ни тесты достижений не диагностируют способности, навыки, одаренность, а только успешность предшествующего достижения. Идет оценка того, чему человек научился.

Классификация тестов достижений.

Широкоориентированные – для оценки знаний и навыков, соответствие основным целям обучения (рассчитанным на продолжительное время). Например: тесты достижений на понимание научных принципов.

Узкоспециализированные – усвоение отдельных принципов, отдельных или учебных предметов. Например: усвоение темы в математике – раздел простые числа – как усвоен этот раздел.

Цели использования тестов достижений.

Вместо учительской оценки. Ряд преимуществ по сравнению с учительской оценкой: объективность - можно выяснить насколько усвоены главные темы, выявление основного. Можно построить профиль усвоения каждой темы.

Тесты достижений очень компактны. Тесты достижений – групповые – поэтому удобны. Можно оценить сам процесс обучения и усовершенствовать его.

Как конструировать тесты достижений?

1. Тест достижений состоит из заданий, которые отражают определенную область содержания курса обучения. Сначала нужно спланировать тему содержания, выявить важные темы в курсе обучения. В конструировании теста достижений должен участвовать учитель, который преподавал темы. Психодиагност должен знать основные темы.

2. Исключить из задания второстепенные знания, малосущественные детали. Желательно, чтобы выполнение заданий в малой степени зависело от механической памяти ученика, а зависело от понимания, критической оценки ученика.

3. Задания должны быть репрезентативны целям обучения. Есть цели обучения, успешность усвоения материала, по которым сложно оценить (например, усвоение темы о правах), тогда нужно составлять задания так, чтобы отразить усвоенность материала.

4. Тест достижений должен полностью охватить ту область учебного предмета, который должен быть изучен. Задания должны быть широко репрезентативны этой изучаемой области.

5. Тестовые задания должны быть свободны от посторонних затрудняющих элементов, не должно быть затрудняющих элементов, не должно быть дополнительных трудностей.

6. Каждое задание сопровождается вариантами ответов.

7. Задание должно быть четко, кратко, недвусмысленно сформулировано. Чтобы ни одно задание не было подсказкой на другое задание теста (проверить после составления).

Ответы должны быть построены так, чтобы исключить возможность напоминания ответов (то есть не давать не относящихся к теме варианты ответов или очень легкие, чтобы испытуемый не смог догадаться, отбросив варианты ответов, как заведомо неприемлемые).

8. Задается критерий выполнения. Психолог разрабатывает большое число заданий, не все они войдут в тест. Для начала все задания проходят проверку. Войдут в тест те задания, которые решаются стопроцентным большинством людей, которые хорошо владеют материалом. Вторая проверка на тех, кто не владеет материалом – они должны выполнить меньше половины. Задания составляются по максимальному критерию. 90-100% - высокий уровень обученности. Тест достижений не оценивается по сопоставлению со статической нормой, а с классом. Сопоставляется индивидуальный результат.

Тесты профессиональных достижений.

Тесты профессиональных достижений используются для оценки эффективности обучения профессионалов или профессиональных тренировок. Для отбора людей на наиболее ответственные должности – профотбор. Используется для оценки уровня квалификации работников, при переходе на другую должность. Цель – оценить уровень обученности профессиональным знаниям, навыкам.

3 формы тестов профессиональных достижений:

1. тест исполнения действия

2. письменные

3. устные тесты профессиональных достижений

1. Тесты исполнения. Выполнение ряда заданий, обнаруживающих владение основными навыками или действиями. Используются те механизмы, аппаратура, инструменты, которые используются в трудовой деятельности или моделировании отдельных элементов профессиональной деятельности, способность воспроизводить отдельные операции.

2. Письменные тесты достижений. Используются там, где требуется выяснить, насколько человек владеет специальными знаниями. Задания на бланках. Выполняются в письменной форме с определенной формой ответов.

3. Устные тесты профессиональных достижений. В период первой мировой войны тесты профессиональных достижений использовались для отбора персонала. Серии вопросов, выявляющих специальные знания. Диагностика в виде интервью. Проводилась индивидуально. Удобны в применении. Не нужно распечатывать. Испытуемый должен в заданной форме отвечать.

Тесты профессиональных достижений создаются, как и тесты достижений. Создается большое количество заданий, заведомо больше в несколько раз. Проверяют. Испытывают три группы работников:

1. эксперты высокой квалификации

2. новички

3. представители смежных профессий.

Задание включается в тест, если:

· задание выполнено большинством экспертов (это есть признак валидности)

· задание выполнено меньшим процентом новичков (приблизительно 60-70%)

· и, если еще меньший процент представителей смежных профессий выполнило задание.

Больше чем для 250 видов профессиональной деятельности разработаны тесты достижений. У нас таких тестов практически нет.

Билет№46 психодиагностика профессиональной деятельности.

Психодиагностика профессиональной деятельности позволяет изучить профессиональные интересы человека при помощи косвенных вопросов, на основе использования специальных психологических тестов , что позволяет глубже ознакомиться со спецификой профессиональной направленности личности и дает возможность выявить степень ее выраженности.

Диагностика профессиональной пригодности: профессиональная пригодность человека определяется как "совокупность психологических и психофизиологических особенностей, необходимых и достаточных для достижения им, при наличии специальных знаний, умений и навыков, общественно приемлемой эффективности труда... ". В это понятие входит также "удовлетворение, переживаемое человеком в процессе самого труда и при оценке его результатов".

Задачи профессиональной диагностики: а) определение наличного уровня профессионализма; б) установление соответствия человека требованиям профессии и соответствия профессии требованиям человека; в) выявление потенциальных профессиональных возможностей человека; г) помощь конкретному работнику в использовании его реальных профессиональных возможностей для эффективного выполнения труда.
Таким образом, диагностика профессиональной деятельности специалиста выполняет не только собственно диагностическую функцию, в которую входят определение уровня профессионализма на данный момент и установление степени соответствия данного человека объективным требованиям данной профессии. В конечном счете результатом проведения диагностики профессиональной деятельности специалиста является определение для него возможных направлений дальнейшего личностного развития и профессионального роста. Определение требований человека к своей профессии, его потенциальных возможностей профессиональной самореализации и реальных профессиональных возможностей существенно помогает специалисту оптимизировать свою профессиональную деятельность.

Психодиагностика кандидатов, отбираемых в правоохранительные органы
Психодиагностическое обследование кандидатов на службу в правоохранительные органы должно производится с помощью специально подобранной батареи тестов,
которые обеспечивают решение следующих задач: отбор кандидатов , наиболее
пригодных по своим индивидуально-психологическим качествам к работе в
правоохранительных органах; выявление и отсев лиц, которые по своим
интеллектуальным способностям могут быть в значительной степени подвержены
профессиональной дезадаптации и, соответственно, не отвечают требованиям,
предъявляемым работникам правоохранительных органов.
При психодиагностическом обследовании кандидатов из резерва на выдвижение
может производится психологическая оценка степени их пригодности для работы в
качестве руководителей. В этом случае используется та же самая батарея
тестов, что и при отборе лиц, впервые поступающих на работу, с той лишь
разницей, что оценке подвергаются также качества, профессионально важные для
лиц, назначаемых на должности руководящих работников.
В соответствии с указанными выше задачами психодиагностические тесты должны:
· выявлять общий уровень интеллектуального развития кандидата,
структуру его индивидуально-психологических свойств, особенности темперамента
и характера, адаптивные возможности к избранной профессии;
· быть достаточно надежными, обладать не только текущей
(диагностической), но и прогностической валидностью, т.е. давать возможность
не только оценивать актуальное состояние кандидата, но и составлять научно
обоснованной, достоверный прогноз относительно его дальнейшего наиболее
эффективного использования;
· быть компактными, удобными для группового обследования кандидатов в
ограниченные промежутки времени с использованием автоматизированной обработки
результатов тестирования;
· перепроверять и взаимодополнять друг друга в целях повышения
надежности, точности и достоверности полученных результатов.
Психологическое обследование лиц, отбираемых в органы прокуратуры, а также
выдвигаемых из кадрового резерва на руководящие должности в прокуратурах
областного и им равного звена должно производиться на основе этих тестов.
После всестороннего изучения опыта профессионально-психологического отбора,
накопленного в некоторых государственно-правовых ведомствах, близких по
характеру работы своих сотрудников к профессиональной деятельности
прокурорских работников, а также на основе специально проведенного
исследования была скомплектована батарея тестов, в которую в качестве
основных вошли следующие психодиагностические методики: шкала прогрессивных
матриц Дж. Равена, 16-факторный личностный опросник Р.Б. Кеттелла (16-ФЛО),
стандартизированный метод исследования личности (СМИЛ) - адаптированный; в
качестве дополнительных: цветовой тест М. Люшера, опросник «Уровень
субъективного контроля» А.М Эткина, опросник УСК, тест «Стратегии поведения в
конфликтной ситуации» К. Томаса.
В ходе проведенного исследования психологические критерии профессиональной
пригодности, выявленные с помощью отобранных тестов, сопоставлялись с
объективными критериями оценки прокурорских работников. Материалы личных дел,
а также факт назначения на руководящую должность в группе прокурорских
работников из резерва для выдвижения, позволили разделить всех обследованных
на четыре группы профессиональной пригодности:
1 - я группа - высокий уровень профессиональной эффективности, полное
служебное соответствие, высоковероятный прогноз профессиональной успешности;
2 - я группа - средний уровень профессиональной пригодности (в основном,
соответствует требованиям прокурорско-следственной специальности);
3 - я группа - кандидат частично соответствует требованиям прокурорско-
следственной специальности (может быть принят на работу при большом числе
вакантных мест);
4 - я группа - низкий уровень профессиональной эффективности, несоответствие
кандидата служебному назначению, прогноз его профессиональной неуспешности.
Шкала прогрессивных матриц Дж. Равена (тест Равена).
Данный тест предназначен для исследования интеллекта субъекта, выявления его
способности логически мыслить, находить существенные связи между предметами и
явлениями, для определения уровня умственной работоспособности, умение
концентрировать внимание, сообразительности в целом, т.е. качеств,
необходимых в деятельности юриста, а более прокурорско-следственных
работников. Низкие результаты по методике позволяют выявить лиц со сниженными
интеллектуальными, познавательными способностями, с недостаточно развитым
аналитическим складом мышления, неспособных концентрировать внимание.

Первое, на чем надо остановиться, рассматривая классификацию тестов, это два подхода, которые в настоящее время сложились в тестировании – тесты, ориентированные на критерий (критериально-ориентированные), и тесты, ориентированные на норму (нормативно-ориентированные).

Критериально-ориентированный тест позволяет оценить, насколько учащиеся достигли заданного уровня знаний, умений и отношений, например, определенного как обязательный результат обучения (образовательный стандарт). В данном случае оценка конкретного ученика не зависит от того, какие результаты получили другие ученики. Результат будет показывать, соответствует ли уровень достижений данного ученика социально-культурным нормам, требованиям стандарта или другим критериям. При данном подходе результаты могут интерпретироваться двумя способами: в первом случае делается вывод о том, освоен или не освоен проверяемый материал (достиг стандарта или нет), во втором – дается уровень или процент освоения проверяемого материала (на каком уровне освоен стандарт или какой процент из всех требований стандарта усвоен).

Нормативно-ориентированный тест ориентирован на статистические нормы, определяемые для данной совокупности учащихся. Учебные достижения отдельного ученика интерпретируются в зависимости от достижений всей совокупности учащихся, выше или ниже среднего показателя – нормы. Происходит распределение учащихся по рангам. Независимо от того, какая шкала используется при этом, все эти шкалы не дают информации об овладении учащимися определенной системой знаний и умений или о достижении ими конкретных целей обучения. Данный подход не соотнесен с содержанием процесса обучения.

Хорошо иллюстрирует разницу в критериально-ориентированных и нормативно-ориентированных тестах схема, предложенная В. С. Аванесовым. Для критериально-ориентированной интерпретации вывод выстраивается вдоль логической цепочки: задания → ответы → выводы о соответствии испытуемого заданному критерию.

Для нормативно-ориентированной ориентации вывод достраивается рейтингом: задания → ответы → выводы о знаниях испытуемого → рейтинг, понимаемый как вывод о месте или ранге испытуемого.

В современных тестах, ориентированных на норму, обычно объединяют задания в определенные группы (кластеры), выполнение которых позволяет описать достижения учащихся по отношению к определенным целям или темам (критериям) обучения. Результаты выполненных заданий позволяют сравнивать различные группы друг с другом и проводить аналогию внутри одной группы.

Критериально-ориентированные тесты определяют, насколько каждый испытуемый владеет знаниями и навыками, необходимыми для выполнения каких-либо учебных или профессиональных задач. Некоторые тесты больше подходят для диагностики развития того или иного качества, умения, навыков, однако сложнее поддаются стандартизации и количественным измерениям.

Нельзя не согласиться с А. Н. Майоровым, который указывает, что термины «нормативные» (нормативно-ориентированные), «критериальные» (критериально-ориентированные) тесты не являются строго корректными. В основе каждого нормативного теста лежат определенные критерии оценивания правильности ответа, и, в свою очередь, каждый критериальный тест должен отвечать на вопрос о том, достигнуты ли при тех или иных его показателях минимально требуемые цели (на данном этапе обучения, в данных конкретных условиях). Однако эта терминология в современной зарубежной и отечественной педагогике и психологии уже является общепринятой и отвечает целям тестирования.

Психологи, занимавшиеся разработкой критериальных тестов, отмечают, что определение задания в качестве критериального обусловлено двумя факторами. Первый заключается в том, что представленный в задании материал позволяет дать обобщенную совокупность знаний и умений, относящихся к внутренне завершенной области учебной или профессиональной деятельности. Второй фактор – возможность представить систематизированный перечень умственных действий, обеспечивающих его выполнение. Ни нормативные, ни критериальные тесты не идеальны. Нормативные тесты критикуют в основном за недостаточную репрезентативность выборок их валидизации и социокультурные аспекты формулировки заданий теста. Зачастую эта критика справедлива, однако сейчас при решении многих диагностических задач в педагогике без нормативных тестов не обойтись, тогда как большинство трудностей критериального тестирования в педагогике связано с тем, что далеко не все учебные предметы имеют профессиональный аналог в каком-либо виде деятельности, связанной с той предметной областью, на которую ориентирован тест.

В последнее время наметилась тенденция объединения двух подходов (критериально-ориентированного и нормативно-ориентированного) при оценке образовательных достижений и использовании в одном инструментарии (например, тесте) характеристик как тестов, ориентированных на норму, так и тестов, ориентированных на критерии.

Стремление объединить два подхода к разработке инструментария можно проиллюстрировать следующими примерами. В соответствии с классической схемой тест для итогового контроля должен разрабатываться в рамках нормативно-ориентированного подхода. Однако итоговые тесты, оценивающие достижение стандарта, предлагается разрабатывать в рамках критериально-ориентированного подхода. По мнению некоторых ведущих специалистов мира (Р. Вуд, В. Ангофф), основная характеристика критериально-ориентированного теста заключается не в наличии проходного критерия (прошел – не прошел, достиг – не достиг), а в тщательном описании проверяемого содержания, разработке теста в строгом соответствии с этим содержанием и описании результатов выполнения тестов в терминах, что освоено из проверяемого содержания. В настоящее время понятия «критериально-ориентированный подход» или «тест» заменяются понятиями «ориентированный на содержание» («сопtеnt-геfегеnсеd») и «ориентированный на цели или требования к уровню подготовки» («оbjective- геfегеnсеd»).

Пример.

Тест может иметь высокую надежность, но низкую валидность. Тест с высокой валидностью обязательно имеет высокую надежность. Если тест имеет низкую валидность, то применять его нельзя, даже если он имеет высокую надежность.

Понятия надежности и валидности педагогического теста чрезвычайно важны, поскольку именно они характеризуют тест как измерительный инструмент. Тест с неизвестными надежностью и валидностью непригоден для измерения. Когда преподаватель, разработав тест, проводит тестирование, то полученные результаты следует интерпретировать (например, для ранжирования испытуемых) очень осторожно, так как неизвестны надежность и валидность вновь составленного теста.

Педагогическое тестирование широко применяется для контроля знаний учащихся в различных целях. По целям применения педагогических тестов их можно разделить на два больших класса - нормативно - ориентированные и критериально - ориентированные.

НОРМАТИВНО-ОРИЕНТИРОВАННЫЙ тест позволяет ранжировать испытуемых по уровню знаний. Такой тест позволяет сравнивать учебные достижения испытуемых друг с другом.

Целью нормативно-ориентированного теста является упорядочение испытуемых по уровню их подготовленности. В результате может оказаться, что все испытуемые плохо справились с тестом - получили низкие индивидуальные баллы. Тем не менее, и в этом случае можно ранжировать испытуемых - кто-то получил низкий балл, а кто-то еще ниже. Возможны случаи, когда какое-то задание не дифференцирует испытуемых, например, задание легкое и все успешно на него ответили. И наоборот, очень трудное задания и все на него не ответили. Такие задания не позволяют провести ранжирование и, поэтому, должны быть удалены из теста. Если все испытуемые не ответили ни на одно задание, или верно ответили на все задания, то нормативно-ориентированный тест не работает, так как не позволяет достичь поставленной цели и подлежит дальнейшей переработке. Отметим, что, возможно, этот тест неплохо будет работать как критериально-ориентированный.

КРИТЕРИАЛЬНО-ОРИЕНТИРОВАННЫЙ тест позволяет выявить степень усвоения испытуемым определенного раздела в заданной предметной области. Эти тесты появились в 60-х годах прошлого века, то есть значительно позже нормативно-ориентированных. Критериально-ориентированные тесты в свою очередь делятся на тесты, ориентированные на предметную область, и квалификационные тесты.

Целью критериально-ориентированного теста является выяснение - знает ли испытуемый стандартный учебный материал (предмет, раздел, тему). В результате тестирования может оказаться, что все испытуемые успешно выполнили все задания. Это означает, что они освоили учебный материал. Если все испытуемые не справились с заданиями теста, то это означает, что учебный материал не усвоен. В обоих случаях тест выполнил свою задачу.

В дальнейшем нам потребуются следующие определения:

Критериально-ориентированный педагогический тест представляет собой систему заданий, позволяющую измерить уровень учебных достижений относительно полного объема знаний, умений и навыков, которые должки быть усвоены учащимися.

Теперь перейдем к сравнению нормативно-ориентированных и критериально-ориентированных тестов.

Внешне оба типа тестов имеют много общего - в них используются тестовые задания сходные по форме, эти задания сопровождаются похожими инструкциями, выполняются задания одинаковым образом. Но, несмотря на внешнюю схожесть, это совершенно разные тесты. Они имеют следующие различия.

1. ЦЕЛЬ СОЗДАНИЯ ТЕСТА. Нормативно-ориентированные тесты создаются специально для того, чтобы сравнить испытуемых в той области содержания, для которой тест предназначен. Эти тесты можно использовать, например, для отбора абитуриентов при поступлении в вузы. В тех случаях, когда конкурс составляет несколько человек на одно место, возникает проблема ранжирования испытуемых с тем, чтобы выбрать наилучших.

Критериально-ориентированные тесты нужны для аттестации испытуемых в определенной области содержания. Такие тесты используются в итоговом тестировании, например по завершении обучения в среднем общеобразовательном учреждении. Здесь важно выяснить - усвоена ли в надлежащем объеме школьная программа. Вопросы ранжирования тут не играют большой роли.

Если критериально-ориентированные тесты использовать в качестве нормативно-ориентированных, то ввиду малой дисперсии тестовых результатов, эти результаты будут отличаться низкой надежностью. Справедливо и обратное - применение нормативно-ориентированных тестов в критериально-ориентированном тестировании также даст малонадежные результаты. Это обусловлено сильной вариацией тестовых заданий по трудности в нормативно-ориентированном тесте.

2. УРОВЕНЬ ДЕТАЛИЗАЦИИ ОБЛАСТИ СОДЕРЖАНИЯ.

Разработка теста начинается с создания его спецификации и эти спецификации для обоих типов тестов сильно отличаются. Спецификации критериально-ориентированных тестов гораздо детальнее описывают элементы области содержания, поскольку это позволит адекватно интерпретировать результаты тестировании. Для нормативно-ориентированных тестов уровень детализации области содержания гораздо ниже. Для этих тестов гораздо важнее получить вариативные тестовые задания.

3. СТАТИСТИЧЕСКАЯ ОБРАБОТКА результатов тестирования. Шкалированные баллы нормативно-ориентированного тестирования основываются на тестовых нормах, полученных на «выборках стандартизации». При критериально-ориентированном тестировании тестовые баллы не связаны с какой-либо нормативной группой испытуемых. Обычно тестовый балл отражает долю правильно выполненных заданий и выражается в процентах.

4. АНАЛИЗ И ОТБОР ТЕСТОВЫХ ЗАДАНИЙ.

Для нормативно-ориентированных тестов большое значение имеют статистические характеристики - уровень трудности задания, его дифференцирующая способность. Если задание имеет средний уровень трудности и высокую дифференцирующую способность, то оно считается хорошим для нормативно-ориентированного теста.

Эти статистические характеристики не имеют большого значения для критериально-ориентированного теста. Здесь главным критерием для включения задания в тест является соответствие специфике и элементу области содержания.

5. РАСПРЕДЕЛЕНИЕ ИСПЫТУЕМЫХ по индивидуальным баллам имеет различный характер для обоих видов тестов. Для нормативно-ориентированного теста кривая распределения симметрична и близка к гауссовой кривой. В случае критериально-ориентированного теста эта кривая несимметрична и обычно сдвинута в область высоких индивидуальных баллов.

6. ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ.

Поскольку цели нормативно-ориентированного и критериально-ориентированного тестирования различны, то и интерпретация полученных данных будет различной.

Результаты нормативно-ориентированного тестирования интерпретируются на основе статистически обоснованных тестовых норм. При этом имеется возможность определить положение испытуемого относительно нормативной группы. Информации же о том, какие как усвоены те или иные разделы, элементы области содержания, нормативно-ориентированный тест дает мало.

Результаты критериально-ориентированного тестирования интерпретируются с точки зрения полноты освоения области содержания, согласно детальной спецификации теста.

Ниже приведена таблица, содержащая сравнение характеристик обоих типов тестов.

Таблица. Сравнительные характеристики нормативно-ориентированных и критериально-ориентированных тестов

Нормативно - ориентированные тесты	Критериально - ориентированные тесты
1. Цель тестирования: возможность сравнения уровня подготовки испытуемых друг с другом в той области содержания, для которой тест предназначен. Пример использования: конкурсный отбор кандидатов на обучение.	1. Цель тестирования: возможность аттестации испытуемого в соответствии с его уровнем усвоения определенной области содержания. Пример использования: итоговая аттестация уровня обученности студентов, уровня профессиональной подготовки кадров.
2. Используемые шкалы: нормативные (или стандартные) шкалы. Необходимо указание среднего значения и стандартного отклонения в выбранной шкале.	2. Используемая шкала - в основном, шкала процентов с выбранным одним (или несколькими) критериальным баллом (баллами). Особое внимание уделяется методики оптимального выбора критериального балла (или баллов).
3. Распределение индивидуальных баллов: близко к нормальному, в большинстве случаев имеет симметричный вид.	3. Распределение индивиду-альных баллов: произвольное, в большинстве случаев асим-метричное и имеет несимметричный вид.
4. Уровень детализации области содержания - несущественен. Авторы теста выбирают наиболее значимые элементы содержания.	4. Уровень детализации области содержания - подробный. Авторы теста разрабатывают спецификацию (план) теста, включающую все элементы содержания. Затем по этой спецификации разрабатываются задания.
5. Нормативная группа испытуемых обязательна. Обработанные (или шкалированные) баллы по результатам нормативно-ориентированного тестирования базируются на статистических данных нормативной группы, то есть специфической достаточно большой выборке испытуемых. В большинстве случаев применяются специальные нормативные таблицы, где каждый индивидуальный балл для данного теста имеет однозначное соответствие с процентильным эквивалентом, определенным на нормативной группе.	5. Нормативная группа испытуемых не является необходимой. Индивидуальный балл испытуемого интерпретируется по отношению к доле учебного материала успешно им освоенного. Чаще всего балл студента отражает процент правильно выполненных заданий и выражается шкале процентов.
6. Статистический анализ и отбор тестовых заданий. Статистические показатели тестовых заданий (в основном это уровень трудности и различающая способность) играют важную роль в отборе заданий. Выбираются задания со средним уровнем трудности (от 0,3 до 0,7) и высокой различающей способностью (большей 0,3). Существуют ряд других важных статистических показателей качества заданий.	6. Статистический анализ и отбор тестовых заданий. Уровень трудности и различающая способность заданий не является существенными факторами включения в состав теста, или наоборот исключения из него. Главное условие отбора заданий - это их соответствие (их конгруэнтность) спецификации и элементу содержания. Статисти-ческие характеристики тестовых заданий используются для составления параллельных форм (вариантов) теста и для выбора оптимального критериального балла.
7. Надежность теста. Оценивается либо путем нахождения корреляциимежду результатами двух тестирований, либо методом расщепления теста на две половины при однократном тестировании.	7. Надежность теста. Оценивается степенью постоянства принятия решения «зачет – незачет» при двукратном тестировании.
8. Валидность. Наряду с содержательной валидностью для тестов конкурсного отбора учащихся особое внимание уделяется высоким показателям прогностической валидности.	8. Валидность. Особое внимание уделяется содержательной валидности. В случае принятия важных решений по результатам тестирования исследуются критериальная и конструктная валидность.

Подытоживая, отметим, что нормативно-ориентированные и критериально-ориентированные тесты сильно отличаются друг от друга. При использовании тестов необходимо придерживаться следующих правил:

1) нельзя использовать критериально-ориентированный тест в качестве нормативно-ориентированного и наоборот;

2) нельзя использовать один и тот же тест и в качестве нормативно-ориентированного и в качестве критериально-ориентированного.

Нарушение этих правил приводит к получению тестовых результатов, обладающих низкой надежностью и большой ошибкой измерения.

Интерпритация материалов психодиагностики

Интерпретация результатов, как правило, ассоциируется с заключительным этапом психодиагностики, на котором происходит обобщение и объяснение всех ранее полученных экспериментальных и клинических данных, в действительности она представляет собой непрерывный процесс, затрагивающий все этапы исследования. Раскрывая понятие «транзитивного диагноза», И. Шванцара с соавторами (1978) отмечают, что интерпретация предполагает объяснение отдельных диагностически значимых фактов в ходе исследования. Это предоставляет психологу возможность пластичной ориентировки в психодиагностической проблеме и изменения программы исследования. Авторы различают интерпретацию ad hoc, которая касается создания гипотез на основании частичных результатов и приводит к изменению программы дальнейшего исследования, и интерпретацию post hoc, в процессе которой психолог устанавливает смысл отдельных полученных фактов в общей психодиагностической картине случая.

При интерпретации данных психодиагностического исследования психолог опирается на представления о множественной детерминации психических явлений и многозначности каждого психодиагностического результата. Точность и адекватность интерпретации поэтому зависят от способности психолога учитывать вероятные связи между диагностическими данными, их ситуационной обусловленностью и возможным их личностным значением.

Другой важный аспект, который необходимо учитывать при интерпретации данных и отразить в психодиагностическом заключении, состоит в том, имеют ли выявленные психологические особенности (нарушения) ситуативный, преходящий характер или относятся к константным особенностям личности, поведения, интеллекта испытуемого.

Психологическая диагностика является основой профессиональной деятельности практического психолога, каким бы видом работ он ни занимался - психологическим консультированием, коррекцией или просвещением.

Психодиагностические материалы: статьи, книги, тезисы конференций, анонсы образовательных программ по овладению диагностическим инструментарием, видеоролики занятий с детьми и новости в сфере психодиагностической науки и практики.

Скачок в психодиагностике произошел благодаря использованию компьютерного тестирования, которое дает возможность изучать процессуальные стороны деятельности, моделируемой тестом, и помогает выявить индивидуальные стратегии в решении заданий, анализирует трудности, испытываемые человеком при выполнении предложенных заданий. Компьютерные тесты предполагают сбор тестовой информации в режиме диалога испытуемого с компьютером. Однако тесты, предполагающие компьютерную обработку информации, собранной на бланках, не являются компьютерными. При компьютерном тестировании больше возможностей соблюдения достоверности теста, т.е. обеспечение защиты его результатов от сознательных фальсификаций (лжи, неискренности испытуемого) или непреднамеренных мотивационных искажений. Также повышается надежность тестирования - стабильность результатов тестовых испытаний, устойчивость теста по отношению к разнообразным источникам помех (шумовых, случайных факторов обследования).

Скрытые возможности человека при компьютерном тестировании могут быть улучшены и раскрыты полнее. В таких тестах моделируется процесс обучения или развития, анализируются усилия, затраченные на обучение, оцениваются успехи, что позволяет сделать заключение об интеллектуальных возможностях испытуемого.

Критериально - ориентированный тест (по-английски criterion-referenced) позволяет оценивать, в какой степени испытуемые овладели необходимым учебным материалом. Относится к тестам достижений . Смотри также Нормативно - ориентированный тест
Возникли в системе образования в США в 60-70е годы, у нас в 80-е (новые тенденции в психодиагностике). До этого использовались 2 вида тестов:

· - тест интеллекта

· - тест достижений в системе образования

Тест интеллекта: особенности тестов интеллекта заключаются в том, что содержание и задание не было связано напрямую с учебной программой. Вывод об успешности учебной деятельности по результатам теста представлял проблему, так как не было соответствия тестам интеллекта и учебных заданий. 0,5 – корреляция успешности тестов интеллекта и успешностью обучения между ними. Невозможно выявить причину специфических трудностей учеников при выполнении учебной деятельности и определить содержание коррекционной работы с этими учениками.

Тесты интеллекта не могут оценить ученика с точки зрения его соответствия конкретным требованиям учебной программы, так как ориентированы на статистическую норму.

Тесты достижений используются в целях контроля успешности усвоения конкретных учебных знаний и навыков. По результатам можно сделать вывод: насколько учитель соответствует требованиям школьной программы, насколько продвинулся и какая помощь ему нужна. Ориентиры не на статистическую норму, а на критерий усвоения. Недостаток – построены бихевиористические модели обучения, контролировали конечный продукт усвоения. А способы усвоения не оценивают. В этом отношении тесты интеллекта давали больше информации.

В 1963 году – Гласер – первый использовал термин критериально-ориентированное измерение.

В 1968 году – описаны способы конструирование Критериально-ориентированные тестов. Появились в системе образования в США.

В начале 70-х годов – интерес к практике критериально-ориентированного измерения. КОРТы отражали: что и как усвоено в процессе программированного обучения. С помощью КОРТа можно оценить насколько человек готов к выполнению какой-либо деятельности, справится ли человек с определенной деятельностью, и на каком уровне может быть выполнена определенная деятельность? КОРТы могут быть полезны не только в системе образования, но и в профессиональной деятельности.

Цели использования КОРТа:

1. Контроль за развитием психических функций, контроль усвоения учебного материала. С помощью КОРТа можно оценить насколько человек продвинулся в усвоении, развитии.
2. Оценить насколько развитие определенной функции усвоения соответствует конкретным требованиям той или иной должности. Прогнозировать справится ли человек с той или иной деятельностью.
Отсюда основная особенность КОРТа – тесты ориентированы на внешние требования, выражающиеся в критерии развития или усвоения (критерий выполнения).

Критерий КОРТ.

Понятие «критерий». На первом этапе рассматриваются 2 концепции критерия:

1. Критерий – это уровень мастерства, выполнение на определенном уровне конкретной деятельности.
2. Критерий – это определенные содержательные и операциональные аспекты деятельности. Набор знаний, навыков, действий, чтобы справиться с определенной деятельностью.
Слились 2 концепции в одну: выполнение деятельности и определенная сформированность знаний, навыков, соответствующая определенному уровню мастерства.

Понимание критерия было отвергнуто, так как вносило путаницу в тестирование. Таким образом, можно было думать, что любой тест можно превратить в КОРТ, если ввести уровень мастерства (уровень выполнения теста) на этапе интерпретации теста. Критерий отражает содержательные и операциональные элементы той деятельности, которую необходимо выполнить, чтобы соответствовать заранее заданным требованиям извне. Чтобы отразить насколько человек владеет определенной деятельностью, КОРТ должен отражать, что человек знает, умеет. КОРТ – особый метод диагностики. Различие на первом этапе: выяснение целей, в отличие от традиционных тестов.

Вторая особенность КОРТа – его результаты представляются не столько в условных баллах, сколько в конкретных показателях усвоенности и сформированности определенных знаний, навыков, умений. Главное не окличество выполненных заданий, а что человек знает, какие операции умеет делать.

Третья особенность КОРТа – показатели выполнения оцениваются не по сопоставимости с нормой, а по сопоставлению КОРТа с критерием (внешний заданный критерий). Что именно человек знает, чтобы рассчитывать на успех в определенной деятельности.

Различают критериально-ориентированные тесты и тесты, ориентированные на статистическую норму.

Норма характеризует выборку или популяцию , но не раскрывает действительных требований к человеку.

^ Социально-психологический норматив (СПН) - система требований, которые общество предъявляет каждому из его членов . Чтобы не быть отторгнутым от существующей общности, человек должен овладеть теми требованиями, которые к нему предъявляются, причем, процесс, этот является активным - каждый стремится занять определенное место в своей социальной общности и сознательно осуществляет этот процесс приобщения к классу, к группе. Эти требования и могут составлять содержание СПН , которые выступают как идеальная модель требований социальной общности к личности.

Следовательно, при оценке результатов тестирования итоги надо подводить по степени близости к СПН, который дифференцируется в образовательно-возрастных границах . Подобные требования могут быть закреплены в форме правил, предписаний, требований к человеку и включать самые разнообразные аспекты: умственное развитие, нравственное, физическое и т. д. Тем более что эти требования, составляющие содержание СПН , вполне реальны и присутствуют в образовательных программах и т.д.

^ Использование в качестве критерия развития СПН выдвигает на первый план качественный способ обработки теста, при котором необходимо учитывать : какие термины и понятия по степени обобщенности усвоены лучше , а какие - хуже ; какие логические операции освоены более, а какие менее - успешно ; в каком круге понятий и терминов ученики ориентируются менее, а в каком - более уверенно . Поэтому в отличие от статистической нормы СПН качественно иным образом рассматривает содержательную сторону развития человека.

Появление критериально-ориентированных тестов (КОРТ) связано стестированием достижений и успехов в учебе как детей, так и взрослых после специальных курсов обучения. Первым, кто обозначил “самостоятельную сущность” нетрадиционной формы тестирования и отделил ее от тестирования, ориентированного на статистическую норму, был Р. Глезер (1963). Он же и ввел термин “criterion referenced measurement” - критериально-ориентированное измерение . Различие между критериально-ориентированным и ориентированными на норму подходами было зафиксировано, но в диагностической практике разница между двумя подходами не выявилась. Это, возможно, зависело от того, что было недостаточным проанализировать практический смысл применения критериально-ориентированной тестовой модели. Было важно другое: разработать методики конструирования и проверки тестов, ориентированные на критерий.

Предметом анализа КОРТ становится содержание деятельности индивида: что индивид знает или умеет делать по отношению к конкретным требованиям, которые предъявляет к нему учебно-образовательная программа. В КОРТе анализ текста должен заключаться в его проверке по характеристикам, сосредоточенным на содержательных и сравнительных особенностях заданий теста, а не только на его статистических показателях. Установление содержательного соответствия теста и реального учебного задания выступает как решающий этап разработки КОРТа. По отношению к КОРТу учебное задание является не “внешним критерием”, но той реальностью, существенные моменты которой данный КОРТ моделирует.

^ Виды критериев в КОРТе. На начальном этапе становления критериально-ориентированного подхода былавыдвинута концепция критерия как уровня выполнения . КОРТы представляют сведения относительно того, что ученик не усвоил. Учащегося возвращают к тем фрагментам учебного материала, на которые ему необходимо обратить внимание (тестирование обнаруживает проблемы в знаниях и неосвоенные навыки).

Критерий как уровень мастерства - эталонная совокупность всех компонентов, составляющих конкретное знание. Располагая такой характеристикой, учитель или исследователь может сравнить то, что делает ученик, с тем, что он должен уметь делать. Особенность КОРТов, направленных на становление уровня мастерства, состоит в том, что они не только выявляют объемы усвоенного материала, но указывают на возможности ученика активно использовать полученные знания в усвоении нового, более сложного материала . Если КОРТы, ориентированные на уровень выполнения, могут установить, что ученик достаточно подготовлен, чтобы перейти на следующий этап обучения, то КОРТы, ориентированные на уровень мастерства, воплощают в себе требования, которые прежде всего обусловлены сложившимися в теории и методике обучения стандартами и образцами усвоения (они зафиксированы как учебные цели).

КОРТ на уровень мастерства рекомендуется строить по ступенчатому признаку. Каждая ступень будет характеризоваться своим уровнем сложности. Сложность здесь понимается как объективная категория, определяемая числом и характером свойств и отношений между элементами учебного задания. Ступенчатая структура представляет возможность не только установить, достаточно ли владеет учащийся определенным умением, но и выявить, в какой мере успешность реализации этого умения определена содержательными характеристиками учебного материала.
^

3.5. Компьютеризация психодиагностических методик

Компьютер не может подменить интуицию и творческую активность человеческой психики, ее пристрастность и избирательность, целостность восприятия и дар предвосхищения.

Но применение ЭВМ открывает широкие перспективы для психологических исследований. В связи с задачами психологической диагностики крайне важно, что с помощью компьютера экспериментатор получает для анализа такие данные, которые без ЭВМ получить практически невозможно: время выполнения отдельных заданий теста, время получения правильных или ошибочных ответов, количество отказов от решения и обращений за помощью, время, затрачиваемое испытуемым, на обдумывание ответа при отказе от решения, время ввода ответа (если он сложен) в ЭВМ и т.д. Эти особенности испытуемых можно использовать для углубленного психологического анализа их деятельности в процессе тестирования.

ЭВМ изменили почти все этапы тестирования - от создания теста до его применения, подсчета первичных показателей, регистрации и интерпретации, обеспечили гибкий и скоростной способ переработки данных.

С момента применения компьютеров в психодиагностике можно выделить несколько направлений в этой сфере.

Одно из них - сбор и обработка тестовых данных, к которым приспособлено большинство современных методик.

Большие возможности в решении указанных задач открываются при использовании ЭВМ для автоматизации стандартизации процедуры тестирования. Применение компьютера обеспечивает массовость испытаний, повышает их объективность и достоверность за счет снижения влияния на испытуемого личности экспериментатора, вариативность некоторых условий тестирования и т.д.

На еще более высоком уровне при этом осуществляется качественный анализ результатов диагностики и машинная интерпретация тестовых показателей. При такой организации тестирования определенные серии ответов связываются с теми или иными словесными формулировками, хранящимися в памяти ЭВМ. При желании можно получить информацию и в виде графиков, таблиц, диаграмм, профилей.

Важную роль играют компьютеры и в решении ряда вопросов, непосредственно связанных с разработкой новых тестов, с созданием алгоритма для их разработки.

Особое значение имеет проблема разработки методики адаптированного (индивидуализированного) тестирования , которому большинство зарубежных авторов отдают предпочтение. При этом подходе каждый испытуемый получает задание, соответствующее ему по трудности. Адаптированное тестирование значительно сокращает время испытаний, позволяет проводить их практически в индивидуальном темпе и повышает точность диагностики свойств испытуемых. Адекватность трудности заданий возможностям испытуемых повышает их мотивацию.

При тестировании с использованием ЭВМ исследователь может получить объективную информацию не только об особенностях выполнения определённых заданий группой учащихся (характеристика теста), но и об индивидуальных данных учащихся (характеристика испытуемого). Имеются в виду показатели умственного развития, скоростные особенности (темп) деятельности испытуемого, динамика его работоспособности, особенности выполнения вербальных и невербальных субтестов и т. д.

^ Выводы

Основная особенность психодиагностики – измерительно -испытательная направленность , за счет которой достигается количественная и качественная оценка изучаемого явления.

Выделяют три основных психодиагностических подхода , которые охватывают все множество имеющихся диагностических методик: “объективный”, “субъективный” и “проективный” .

Выделяют четыре основных типа методик: тест; опросники и анкеты; проективные техники и психофизиологические методики .

Для того чтобы тест считался научно-эффективным, он должен пройти проверку по четырем специальным критериям. Эти критерии : стандартизация, нормы, надежность, валидность.
Стандартизация - это единообразие процедуры проведения и оценки выполнения теста . Таким образом, стандартизация рассматривается в двух планах: 1) как выработка единых требований к процедуре эксперимента и 2) как определение единого критерия оценки результатов диагностических испытаний.
Надежность теста – постоянство и устойчивость результатов тестирования.
Валидность теста – пригодность теста измерять то свойство, для измерения которого он предназначен.

Не существует какого-либо единственного показателя, демонстрирующего валидность теста. Когда тест проверяется на валидность, важно указывать, на какой вид валидности .
Различают тесты, ориентированные на критерий, и тесты, ориентированные на норму.