КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Лекция 3Стр 1 из 2Следующая ⇒ ИСТОРИЯ РАЗВИТИЯ СИСТЕМЫ ТЕСТИРОВАНИЯ ЗА РУБЕЖОМ И В РОССИИ Теория и практика тестирования в современном его понимании имеют уже более чем столетнюю историю. Время зарождения тестологии относят к концу XIX века, когда психологи стали исследовать индивидуальные различия физических, физиологических и психических особенностей человека. Одним из первых, кто начал использовать тестовые технологии для измерения индивидуальных особенностей, стал английский биолог Френсис Гальтон. Он занимался вопросом наследственности, при этом разработал ряд методик для определения зрительной, слуховой и тактильной чувствительности, а также для определения мускульной силы, скорости реакции и др. Чтобы собрать как можно больше эмпирических данных, Гальтон обследовал множество учреждений в системе образования с целью получить систематические измерения антропометрических характеристик учащихся. В 1884 году он организовал антропометрическую лабораторию на Всемирной выставке в Лондоне, где каждый желающий за небольшую плату мог измерить свои физические возможности по 17 показателям: рост, вес, сила кисти, сила удара, различения цвета, острота зрения и др. Таким образом накапливались первые систематические данные по индивидуальным особенностям простых психофизических функций. По мнению Ф.Гальтона, тесты сенсорного различения можно использовать как средство оценки интеллекта человека. Ф.Гальтон сформулировал три принципа тестирования, эти выводы сохраняют актуальность до сих пор: 1) применение серии одинаковых испытаний к большому количеству испытуемых; 2) необходимость накопления и обработки статистических результатов; 3) установление эталонов оценки. Важнейшим вкладом Гальтона в развитие тестологии является разработка и использование методов математической статистики для обработки полученных данных по индивидуальным различиям. Он вводит метод сравнения двух рядов переменных, для оценки этого соотношения используется особая величина, индекс - коэффициент корреляции. Гальтон также изучает взаимосвязь переменных, для чего впервые использует построение линий регрессии одной переменной на другую. Идеи Ф.Гальтона активно развивает американский психолог Джеймс Мак-Кин Кеттелл (1860 - 1944), который некоторое время работал в лаборатории Гальтона. В 1890 году выходит статья Кеттелла «Умственные тесты и измерения», где описывается серия тестов для определения индивидуально-психологических качеств и обосновывается эффективность использования статистической обработки результатов. Впоследствии американский психолог разработал около пятидесяти наборов заданий, которые назывались «умственными тестами»: практически же это были тесты сенсорного различения и скорости реакции, которые, по мнению Кеттелла, можно было использовать для измерения интеллекта. Несмотря на то, что тесты Кеттела позволяли оценить только элементарные психофизические процессы и реакции человека и не затрагивали высших психических функций человеческого мозга, его идеи использования тестирования и статистического анализа сыграли большую роль в становлении теории и практики тестирования. Кеттелл рассматривал тестирование как научный метод и выдвигал ряд требований к проведению тестирования, чтобы результаты были приближены к объективным. Он сформулировал следующие требования: n необходимость создания одинаковых условий для всех испытуемых; n ограничение времени тестирования (1 час); n использование одинаковых инструкций и четкое понимание испытуемыми, предлагаемых задач для выполнения; n эксперимент должен проводиться без зрителей; n результаты тестирования должны обрабатываться с помощью статистических методов анализа (находится минимальный, максимальный и средний результаты, рассчитывается среднее арифметическое и среднее отклонение). Вернувшись в США Дж.Кеттелл продолжил работу по разработке и использованию тестов, активно пропагандируя новые методы измерения. В течение 1895 - 1896 гг. в Америке создаются два национальных комитета, с целью организации тестологов в области теоретических исследований и практики создания качественных тестов и их применения. Новый этап в развитии тестологии связан с деятельностью французского психолога Альфреда Бине (1857 - 1911). Он разрабатывает оригинальные методики измерения интеллекта. Критически восприняв достижения своих предшественников Ф.Гальтона и Дж.Кеттелла (Бине прежде всего не устраивали попытки оценить уровень интеллекта через измерение элементарных психических процессов), Бине идет по пути измерения сложных интеллектуальных функций. Работа в Комиссии по изучению методов обучения умственно отсталых детей с 1904 года дала возможность Бине реализовать свои идеи на практике. Совместно с Теодором Симоном Бине создает тестовые задания, направленные на дифференциацию детей на способных к обучению, но ленивых или отстающих, и на детей умственно отсталых. Шкала Бине-Симона (шкала 1905 года) состояла из 30 заданий, которые были расположены по возрастанию трудности. Уровень трудности был определен по результатам обследования 50 нормальных детей в возрасте от 3 до 11 лет и небольшого числа слабоумных детей. Тесты были рассчитаны на оценку способности к суждению, пониманию и рассуждению, которые, по мнению Бине, и являются основными компонентами интеллекта. Вероятность успешного выполнения определялась возрастающей трудностью заданий теста и увеличивалась в зависимости от возраста испытуемого. В 1908 году появляется новый, переработанный вариант шкалы: увеличивается количество заданий, убираются неудачные задания, расширяется выборка стандартизации. Бине и Симон заявляют и новую цель шкалы: теперь это не только дифференциация детей на нормальных и умственно отсталых, но и выделение среди нормальных детей различных возрастных уровней интеллектуального развития. Группировка тестов по возрастным уровням позволила определить нормы для детей разных возрастных категорий. «Показатель ребенка по всем тестам мог бы в этом случае выражать умственный уровень, соответствующий возрасту нормальных детей, чье выполнение было таким же» [2]. Третий вариант шкалы Бине-Симона (1911) содержал незначительные изменения заданий и возрастные рамки шкалы были расширены до 15 лет. Самым главным на этом этапе работы стала попытка стандартизировать шкалу и определить ее валидность. Тесты Бине-Симона привлекли внимание психологов разных стран. Они активно переводились и адаптировались. В Америке появилось много переработанных вариантов тестов Бине-Симона. Одним из удачных вариантов признан тест, разработанный Левисом Мадисоном Терменом (Странфордская шкала интеллекта Бине). В этом варианте был впервые использован коэффициент интеллектуальности - показатель умственного развития (IQ). Надо отметить, что активная работа по созданию, совершенствованию и применению тестов, сопровождалась разработкой статистических методов обработки полученных результатов. Уже в работах Ф.Гальтона мы видим использование этих методов. В этом направлении работали многие его ученики, среди них и Карл Пирсон, который заложил основы в 1896 (Майоров) теории корреляции, под влиянием его работ формируется прикладная статистика. В начале ХХ века Чарльз Спирмен, английский психолог, далее развивает теорию корреляции. Он приходит к выводу, что корреляция между двумя переменными свидетельствует о наличии общего фактора, некоторой причины, определяющей эти переменные, и специфических факторов, характерных для каждой переменной. В начале возникновения и становления тест как измерительный инструмент использовался только в рамках эксперимента, был предназначен исключительно для индивидуального измерения. Групповые тесты впервые появились в США в 1917 году, когда Америка вступила в первую мировую войну и возникла необходимость быстро определить интеллектуальный уровень полутора миллионов вступающих в ряды армии. С этой целью использовались тесты интеллекта Артура Синтона Отиса. Тесты Отиса включали два вида: альфа - вербальный тест для владеющих английским языком и бета-тест - невербальный, рассчитанный на неграмотных и новобранцев иностранного происхождения. По окончании первой мировой войны после некоторой переработки эти тесты стали повсеместно использоваться как групповые тесты интеллекта в образовательных учреждения, среди взрослого населения. В начале ХХ века также возникает идея использования тестирования для измерения уровня учебных достижений. Американский психолог В.А.Макколл предлагает разделить тесты на психологические (определение уровня умственного развития) и педагогические (измерение успешности учащихся по предметам за определенный период обучения). Целью педагогического тестирования, по мысли Макколла, должно быть выделение и объединение учащихся с близкими показателями уровня обученности. Основоположником педагогических измерений считается американский психолог Эдуард Ли Торндайк, который создал первый педагогический тест (ability tests). Первые тесты учебных достижений представляли собой тесты на решение арифметических задач, правописание, оценка почерка, рассуждение. Свои выводы по использованию тестовых методов в педагогике Торндайк обобщает в книге «Введение в теорию психологии и социальных измерений» (1904). В 1915 г. американец Р.М.Йеркс предлагает новую систему подсчета результатов испытуемых. Он вводит балльную систему (за правильное решенное задание теста испытуемый получает определенное количество баллов) вместо возрастных долей, которые использовались А.Бине. Полученное количество баллов затем переводилось в коэффициент одаренности или успешности в соответствии с разработанными стандартами. Так как уже в 10-20 гг. тестирование выходит за рамки научного эксперимента и превращается в явление массовое, то для упорядочения работы по разработке и использованию тестов создаются специальные организации и службы государственного уровня. В 1926 г. Совет колледжей (США) принял тест SAT и утвердил наборы заданий для профессиональной оценки деятельности педагогов. В 1947 г. создается в США Служба тестирования в образовании (Educational Testing Service), которая является и научно-исследовательским центром, и организацией, контролирующей проведение тестирования на всех уровнях образования в стране. К 1961 году только в США были созданы 2126 сдантартизированных тестов. Здесь существует множество тестовых издательств, общая продукция которых представляет несколько тысяч различных тестов. Интеграционные процессы современной цивилизации дали толчок к развитию новых направлений педагогического тестирования. Возникла идея международного сравнительного исследования с целью оценки качества образования различных стран с международным контекстом. Проведение международных исследований предоставляет странам возможность всесторонней оценки эффективности своих образовательных стран и сравнить подготовку своих учащихся с международными стандартами. В современных условиях стремительного нарастания информации педагогам необходимо изучать опыт других стран. Поиску новых, более эффективных систем преподавания и должны способствовать международные сравнительные исследования. Лидирующая роль в проведение подобных исследований принадлежит Международной ассоциации по оценке учебных достижений (IEA - International Association for the Educational Achievement) - независимой организации, объединяющей научные центры более 50 стран мира и проводящей сравнительные исследования по оценке эффективности образовательных систем стран мира, осуществляющих различную политику в области образования. Первые исследования IEA проводились совместно с ЮНЕСКО. За 35 лет существования, начиная с 1959 года, IEA проведено более 15 исследований. Во многих странах мира результаты исследований IEA дали толчок или явились основой для проведения реформ в области образования. Россия стала членом IEA в 1991 г. и с этого времени принимает активное участие во всех ее исследованиях (TIMSS - третьем международном исследовании по естественно-математическому образованию, LES - исследовании по иностранным языкам и CIVIC - исследовании по социальным наукам). Во второй половине ХХ века разрабатывается более совершенная модель анализа полученных результатов - современная теория тестов (IRT). IRT является разновидностью методологии латентно-структурного анализа (ЛСА) (метод П.Ф.Лазерсфельда). В этот период теория тестов из описательной науки, занятой собиранием и систематизацией фактического материала, начинает превращаться в науку об отношениях, о законах функционирования и оценивания поведения испытуемых. Г.Раш предлагает ввести взаимоотношение двух параметров (тета - уровень подготовленности и бета - трудность задания) как разность тета минус бета. Он же предложил математическую модель (вероятность правильного ответа испытуемого и латентная переменная его обученности связаны функцией), которая позволяет определить вероятность правильного ответа испытуемого. Эту модель Раша принято называть однопараметрической, позднее А.Бернбаум развил идеи Раша и вывел двух- и трехпараметрические модели. Параллельно разрабатывались компьютерные программы для обработки тестовых результатов с помощью моделей IRT. В 1974 году Ф.Лорд создал целый ряд оценочных моделей, которые легли в основу программы LOGIST. Более совершенные программы появились в конце 80-х - начале 90-х гг. ХХ века - программа Con Quest, SPSS (?). В середине 70-х гг. ХХ века разработаны новые критерии, предъявляемые к тесту как способу оценки качества: n адаптивность систем тестирования к качеству выводов испытуемых; n объективность педагогических измерений; n экономия ресурсов и времени проверок; n ограничение на место для записи тестируемых заключений; n возможность применения различных форм предъявления тестовых заданий [7]. Новым этапом в тестологии считается адаптивное тестирование.
|