есть желание заново пройти курс "Тестирование в современном высшем образовании"
|
Задания в тестовой форме
3.3. Цели, классы, типы, этапы, свойства тестов и тестирования
Культуру тестирования необходимо возрождать, развивать и в нашей образовательной системе, но при этом совершенно не обязательно копировать все цели, критерии и атрибуты зарубежной культуры тестирования.
Культура педагогического тестирования должна переходить в культуру профессионального тестирования (при приеме на работу, проверке профессиональной пригодности, качества и т.д.).
Культура тестирования важна лишь для тех, кто заинтересован в повышении эффективности обучения, особенно, с использование новых методик и достижений.
Цели и функции тестирования и тестов могут быть различными. Выделим основные цели и функции:
- информационная цель, информационная функция;
- диагностическая цель, диагностическая функция;
- обучающая цель, обучающая функция;
- мотивационная цель, мотивационная функция;
- аттестационная цель, аттестационная функция.
Классификация тестов проводится по различным классификационным признакам.
- По процедуре создания – стандартизованные, не стандартизованные.
- По средствам предъявления – бланковые (бумажные), предметные (натурные), аппаратные, компьютерные (адаптивные и неадаптивные).
- По характеру предъявления (генерирования) – детерминированные, стохастические, динамические.
- По направленности – тесты интеллекта, личностные тесты, тесты достижений.
- По характеру действий – вербальные, невербальные.
- По ориентации – тесты скорости, тесты продуктивности или результативности, смешанные тесты.
- По однородности – гомогенные, гетерогенные.
- По объективности – объективные, проективные.
- По специализации – широко-ориентированные, узко-ориентированные.
- По целям – информационные, диагностические, обучающие, мотивационные, аттестационные.
- По широте использования – используемые преподавателем, группой преподавателей или администрацией, формирования групп, аттестации.
- По форме – закрытого типа, открытого типа, на установление соответствия, на установление правильной последовательности действий (часто рассматривают и их подтипы, например, задания закрытой формы с однозначным выбором одного, с выбором наиболее полного из правильных, с выбором нескольких наиболее правильных и т.д.); эта классификация – часто условная (с точки зрения валидности) и неполная, хотя и распространенная.
- По методологии интерпретации результатов – нормативно-ориентированные и критериально-ориентированные.
Есть и другие подходы к классификации тестов.
Выбор класса зависит от вида контроля над учебной деятельностью обучаемых, который может быть вступительным, текущим, рубежным (промежуточным) или итоговым контролем.
Для стандартизации требований к абитуриентам и унификации (единообразия) процедуры вступительных испытаний тестовый контроль абитуриентов должен быть организован централизовано.
Пример. Примеры тестирования различного типа – ЕГЭ для выпускников школ РФ, SAT (Scholastic Assessment Tests – Тест Академического Оценивания) для поступающих и колледжи США.
Тестирование имеет три основных этапа:
- проектирование и разработка (выбор) теста;
- реализация процедуры тестирования;
- анализ, оценка и интерпретация результатов тестирования.
Существуют два основных подхода использования педагогически и профессионально наиболее важных аттестационных тестов – нормативно-ориентированный и критериально-ориентированный.
Нормативно-ориентированный подход служит для сравнения учебных или профессиональных достижений отдельных испытуемых по отношению к некоторому эталонному, нормативному образцу, например, исполнению должностных обязанностей.
Нормативно-ориентированные педагогические тесты используются для получения надежных и нормально распределенных тестовых баллов. После выполнения нормативно-ориентированного теста (комплекса тестов), всем справившимся с тестом выставляются тестовые баллы (по некоторой заранее определенной системе оценивания заданий), а затем на основе анализа распределения тестовых баллов испытуемых (выборки) определяется норма. Далее тестовые баллы оцениваются (например, по пятибалльной системе) и каждому тестированному выставляется оценка.
Критериально-ориентированный подход служит для оценки степени овладения знаниями, умениями и навыками всех испытуемых.
Критериально-ориентированные педагогические тесты используются для интерпретации результатов тестирования (принятия решений) и оценки уровня учебных достижений относительно некоторого образа полного или достаточного овладения этими знаниями, умениями и навыками. Критериально-ориентированные тесты ориентированы на определенный критерий оценки испытуемых, на предварительно определенную (тестирующими или администрацией) шкалу измерения, в соответствии с которой каждому тестируемому выставляется оценка.
Оба подхода важны и взаимосвязаны, имеют много общих свойств. В то же время, у них различные цели, уровни детализации содержания, мощность выборочного множества, технология составления и оценивания тестов (в том числе и шкала оценивания), методы анализа и принятия решения.
Тесты обладают следующими основными свойствами.
Валидность – мера соответствия теста измеряемым знаниям, умениям и навыкам, для проверки которых был разработан тест, мера соответствия стандартам и программам обучения, а также результатам тестирования. Это наиболее важная, комплексная характеристика, отражающая "инструментальную" точность тестирования.
Сложность – мера умственных усилий, требуемых для выбора ответа.
Часто эта мера называется весом и определяется как доля правильных или неправильных ответов при ответе на задание в группе тестируемых.
Внутренняя сложность определяется сложностью тестовых заданий (тестов) в тесте (группе тестов).
Внешняя сложность определяется сложностью взаимоотношений с окружением (тестируемые, тестирующие, инструментальные среды), сложностью управления системой, потенциально оцениваемых по обратным связям системы и среды, сложность анализа результатов тестирования и принятия решений.
Эти два вида сложности взаимосвязаны и взаимозависимы (рис. 2). Как правило, внутренняя сложность определяет и внешнюю сложность.
Надежность – мера правильности и адекватности отражения тестом уровня знаний учащихся.
Надежный тест обеспечивает равные права каждой группе обучаемых и каждому обучающемуся в группе. Обычно используемый 95%-ый уровень значимости может служить показателем достаточной надежности (с коэффициентом 0,95).
Устойчивость теста – мера сохранения надежности и валидности при переносе теста в другую, аналогичную среду, мера равнозначности и однородности тестов для различных групп учащихся.
Шкалируемость теста – способность теста отображать результаты учебных достижений в некоторой задаваемой системе (шкале) оценок или баллов.
Репрезентативность теста (банка или базы тестов) – мера полноты охвата заданиями учебного материала, программы, отражения тестами различных уровней обучения.
Значимость теста – мера необходимости, актуальности включения в тест ключевых знаний, надежно свидетельствующих о репрезентативности теста.
Дискриминантность теста – мера дифференциации тестируемых относительно максимального или минимального уровня обучения.
Достоверность, научность, непротиворечивость теста – мера истинности теста, согласованности, соответствия современному состоянию науки и технологии, методике обучения.
Необходимо обеспечить согласованность заданий теста как между собой (внутренняя согласованность), так и с другими тестами (внешняя согласованность).
Под гипотезой тестирования будем понимать некоторое утверждение (предикат), подлежащий проверке (на истинность).
Гипотеза может быть детерминированной (выполнено, не выполнено), вероятностной (с задаваемой вероятностью истинности) или нечеткой (формулируемой с помощью аппарата нечеткой логики).
Основная системная цель тестирования – использование потенциальной возможности распространения (анализа и обобщения) данных по выборке на другие выборки или даже на генеральную совокупность, наблюдаемых в тестовых испытаниях ситуаций для данной совокупности тестированных, на другие совокупности или, возможно, – на всю образовательную систему в целом.