КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Надёжность и её видыНадёжность методики является основным критерием качества методики и означает относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Это помехоустойчивость теста, независимость его результатов от действий возможных случайных факторов. Степень надежности методик зависит от многих причин. Поэтому важной проблемой практической диагностики является выяснение факторов, снижающих точность измерений. Была сделана попытка составить классификацию таких факторов. К числу таких факторов следует отнести: - нестабильность диагностируемого свойства; - разнообразие внешних материальных условий тестирования, меняющихся от одного испытуемого к другому (время суток, освещённость, наличие посторонних звуков, отвлекающих внимание, и т.д.); - динамические внутренние факторы, по-разному действующие на разных испытуемых в ходе тестирования (время так называемой «врабатываемости», скорость утомления и т.д.); - информационно-социальные обстоятельства (различная динамика в установлении контакта с психологом или лаборантом, проводящим тестирование; возможное наличие других людей в помещении; наличие предыдущего опыта знакомства с данным тестом и т.п.); - несовершенство диагностических методик (небрежно составленная инструкция, задания по своему характеру разнородны, нечётко сформулированы указания по предъявлению методики испытуемым и т.д.); - элементы субъективности в способах оценки и интерпретации результатов (когда ведётся протоколирование ответов испытуемых, оцениваются ответы по степени полноты, оригинальности и т.п.). Если все эти факторы иметь в виду и постараться в каждом из них устранить условия, снижающие точность измерений, то можно добиться приемлемого уровня надёжности теста. Одним из важнейших средств повышения надежности психодиагностической методики является единообразие процедуры обследования, его строгая регламентация: одинаковые для обследуемой выборки испытуемых обстановка и условия работы, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с испытуемыми, порядок предъявления заданий и т. д. При такой стандартизации процедуры исследования можно существенно уменьшить влияние посторонних случайных факторов на результаты теста и таким образом повысить их надежность. На характеристику надежности методик большое влияние оказывает исследуемая выборка. Она может как снижать, так и завышать этот показатель, например, надежность может быть искусственно завышена, если в выборке небольшой разброс результатов, т. е. если результаты по своим значениям близки друг к другу. В этом случае при повторном обследовании новые результаты также расположатся тесной группой. Возможные изменения ранговых мест испытуемых будут незначительными, и, следовательно, надежность методики будет высокой. Такое же неоправданное завышение надежности может возникнуть при анализе результатов выборки, состоящей из группы, имеющей очень высокие результаты, и из группы с очень низкими оценками по тесту. Тогда эти далеко отстоящие друг от друга результаты не будут перекрываться, даже если и вмешаются в условия эксперимента случайные факторы. Поэтому в руководстве обычно делается описание выборки, на которой определялась надежность методики. В настоящее время надежность все чаще определяется на наиболее однородных выборках, т. е. на выборках, схожих по полу, возрасту, уровню образования, профессиональной подготовке и т. п. Для каждой такой выборки приводятся свои коэффициенты надежности. Приводимый показатель надежности применим только к группам, подобным тем, на которых он определялся. Если методика применяется к выборке, отличающейся от той, на которой проверялась ее надежность, то эта процедура должна быть проведена заново. К.М. Гуревич, проведя тщательный анализ зарубежной литературы по этой проблеме, предложил толковать надежность как комплексную характеристику, включающую: - надежность самого измерительного инструмента; - стабильность изучаемого признака; - константность, т. е. относительную независимость результатов от личности экспериментатора. Основные показатели он предложил обозначить следующим образом: - показатель, характеризующий измерительный инструмент, предлагается называть коэффициентом надежности; - показатель, характеризующий стабильность измеряемого свойства, – коэффициентом стабильности; - показатель оценки влияния личности экспериментатора – коэффициентом константности. Именно в таком порядке рекомендуется осуществлять проверку методики на надежность: целесообразно сначала проверить инструмент измерения. Если полученные данные удовлетворительны, то можно переходить к установлению меры стабильности измеряемого свойства, а уже после этого, при необходимости, заняться критерием константности. Остановимся на более подробном рассмотрении этих показателей, характеризующих надежность психодиагностической методики. Определение надежности измерительного инструмента.От того, как составлена методика, насколько правильно подобраны задания с точки зрения их взаимосогласованности, насколько она однородна, зависит точность, объективность любого психологического измерения. Внутренняя однородность методики показывает, что ее задания актуализируют одно и то же свойство, признак. Для проверки надежности измерительного инструмента, говорящего о его однородности (или гомогенности), используется так называемый метод «расщепления». Обычно задания делятся на четные и нечетные, отдельно обрабатываются, а затем результаты двух полученных рядов коррелируются между собой. Для применения этого способа нужно поставить испытуемых в такие условия, чтобы они смогли успеть решить (или попытаться решить) все задания. Если методика однородна, то большой разницы в успешности решения по таким половинкам не будет, и, следовательно, коэффициент корреляции будет достаточно высоким. Можно делить задания и другим путем. Например, можно сопоставить первую половину теста со второй, первую и третью четверть – со второй и четвертой и т. п. Однако «расщепление» на четные и нечетные задания представляется наиболее целесообразным, поскольку именно этот способ наиболее независим от влияния таких факторов, как врабатываемость, тренировка, утомление и пр. Методика признается надежной, когда полученный коэффициент не ниже 0,75–0,85. Лучшие по надежности тесты дают коэффициенты порядка 0,90 и более. Определение стабильности изучаемого признака. Определить надежность самой методики – это не значит решить все вопросы, связанные с ее применением. Нужно еще установить, насколько устойчив, стабилен признак, который исследователь намерен измерять. Было бы методологической ошибкой рассчитывать на абсолютную стабильность психологических признаков. В том, что измеряемый признак со временем меняется, нет ничего опасного для надежности. Все дело в том, в каких пределах варьируются результаты от опыта к опыту у одного и того же испытуемого, не приводят ли эти колебания к тому, что испытуемый по непонятным причинам оказывается то в начале, то в середине, то в конце выборки. Сделать какие-то конкретные выводы об уровне представленности измеряемого признака у такого испытуемого нельзя. Таким образом, колебания признака не должны иметь непредсказуемый характер. Если не ясны причины, по которым происходит резкое колебание, то такой признак не может быть использован в диагностических целях. Для проверки стабильности диагностируемого признака, свойства используется прием, известный под названием тест-ретест. Он заключается в повторном обследовании испытуемых с помощью той же методики. О стабильности признака судят по коэффициенту корреляции между результатами первого и второго обследования. Он будет свидетельствовать о сохранении или несохранении каждым испытуемым своего порядкового номера в выборке. Коэффициент стабильности методики должен быть достаточно высоким (не ниже 0,80). Определение константности (относительной независимости результатов от личности экспериментатора). Поскольку методика, разработанная для диагностических целей, не предназначена для того, чтобы вечно оставаться в руках своих создателей, крайне важно знать, в какой мере ее результаты поддаются влиянию личности экспериментатора. Хотя диагностическая методика всегда снабжается подробными инструкциями по ее применению, правилами и примерами, указывающими, как проводить эксперимент, однако регламентировать манеру поведения экспериментатора, скорость его речи, тон голоса, паузы, выражение лица очень трудно. Испытуемый в своем отношении к опыту всегда отразит то, как сам экспериментатор к этому опыту относится (допускает небрежность или действует точно в соответствии с требованиями процедуры, проявляет требовательность, настойчивость или бесконтрольность и т. п.). Хотя в тестологической практике критерием константности пользуются нечасто, это не может служить основанием для его недооценки. Если у авторов методики возникают подозрения по поводу возможного влияния личности экспериментатора на исход диагностической процедуры, то целесообразно проверить методику по этому критерию. Коэффициент константности определяется путем корреляции результатов двух опытов, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными экспериментаторами. Коэффициент корреляции не должен быть ниже 0,80. Точность, достоверность тестовТочность – способность методики тонко реагировать на малейшие изменения измеряемого свойства. Чем больше уровней, градаций, тем точнее методика. Чем точнее психодиагностическая методика, тем тоньше с ее помощью можно оценивать градации и выявлять оттенки измеряемого качества. Однако в практической психодиагностике далеко не всегда требуется очень высокая степень точности оценок. Ее необходимая практическая мера определяется задачей дифференциации, или разделения испытуемых на группы. Если, например, всю исследованную выборку испытуемых нужно разделить всего лишь на две подгруппы, то и точность применяемой методики должна соответствовать именно этому делению, не больше. Если необходимо разделить испытуемых на пять подгрупп, то достаточно применить методику, имеющую измерительную шкалу, состоящую из пяти пунктов, скажем такую: «да», «скорее да, чем нет», «ни да, ни нет», «скорее нет, чем да», «нет».Однозначность – характеризуется тем, в какой степени полученные данные отражают изменения того и только того качества, для оценивания которого методика была предназначена. Если наряду с этим свойством в получаемых показателях отражаются и другие, никак не связанные с данной методикой, выходящие за пределы ее валидности, то считается, что методика не соответствует критерию однозначности, хотя при этом частично может оставаться валидной. Например, если экспериментатора интересуют оценки мотивов поведения человека, и для того, чтобы их получить, он задает испытуемому прямые вопросы относительно мотивов его поведения, то ответы на эти вопросы вряд ли будут соответствовать критерию однозначности. В них почти наверняка отразятся и степень осознания испытуемым мотивов своего поведения, и его желание предстать в благоприятном свете в глазах экспериментатора, и оценки им возможных последствий диагностического эксперимента, и многое другое. Достоверность– это психометрическое свойство точности, обеспечивающее её защиту от сознательных фальсификаций или неосознанных мотивационных искажений. Отдельное требование достоверности предъявляется к опросникам, где несколько вариантов ответов. С этой целью в методику вводят шкалу лжи, или корректурную. Она основывается на принципе социальной желательности, т.е. следует давать испытуемым социально одобряемую информацию. Если испытуемый набрал определённое количество баллов, ему предлагают ещё раз пройти диагностику.
|