КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Смотреть Лабораторную работу №2 ⇐ ПредыдущаяСтр 4 из 4 2. Основные задачи репрезентационной теории измерений. Формальная адекватность математического метода. Цель построения интервальной шкалы. Начнем с перечисления тех полезных для социолога результатов, которые содержатся в РТИ. Эти результаты сводятся к возможности решения следующих задач. 1. Доказательство существования шкал. РТИ содержит много результатов, имеющих примерно такую формулировку: если ЭС обладает такими-то свойствами (при этом она может быть определена и не в виде ЭСО; в качестве "свойств" может выступать, например, требование адекватности одной из рассмотренных выше моделей восприятия), то ее можно гомоморфно отобразить в ЧСО. Подобные утверждения, несомненно, могут быть весьма полезны. Другое дело, что упомянутое "если" может быть весьма проблематичным для социолога. 2. Определение степени единственности шкалы. Подчеркнем, что именно в рамках РТИ было доказано, что с помощью ряда конкретных методов шкалирования получаются шкалы определенного типа. Это касается, например, многих методов парных сравнений, в частности тех, которые были рассмотрены в п. 6. 3. Проблема адекватности математического метода и ее решение в теории измерений. Проблема адекватности является центральной для РТИ. Описанное выше стремление ученых к выработке четких представлений о том, что есть измерение в гуманитарных науках, было направлено в основном на решение вполне практической задачи — понять, какими методами можно анализировать данные, полученные по экзотическим (с точки зрения естественнонаучных критериев) шкалам. РТИ дала ответ на этот вопрос. Однако до сих пор этот ответ не используется социологами. В частности, как мы уже говорили, в большинстве учебных пособий советы, дающиеся читателю, формулируются некорректно. Советы эти обычно носят характер рекомендаций такого рода: "Для номинальных шкал в качестве меры средней тенденции можно использовать только моду"; "Среднее арифметическое всегда можно использовать для интервальной шкалы". Некорректными эти советы являются по крайней мере в силу следующих причин. Во-первых, эти утверждения в большинстве своем просто неверны. Поясним это на примере двух сформулированных выше положений. В п. 1.4 мы показали, что для номинальных шкал иногда можно использовать среднее арифметическое. Можно показать также, что для интервальной шкалы среднее арифметическое может быть неприменимо. Скажем, измерив средний вес мух из некоторой совокупности, мы можем выяснить, что он равен 2, а средний вес слонов — 1. На основе этого сделаем вывод, что слоны в среднем легче мух. Любой нормальный человек скажет, что здесь что-то не то, и будет прав, поскольку в первом случае мы измеряли вес в граммах, а во втором — в тоннах. Надеемся, читатель понял, что за этим стоят весьма нетривиальные положения. Во-вторых, нельзя все рекомендации свести к указанию того, для какой шкалы мы можем, а для какой не можем использовать тот или иной конкретный метод. И методов имеется бесконечное количество (по крайней мере, в потенции), и шкал. В-третьих, приведенные примеры свидетельствуют, что в принципе нельзя говорить о применимости либо неприменимости какого-либо конкретного метода. Все зависит от того, как мы соответствующие результаты интерпретируем.
Интервальная шкала. Интервальная шкала приписывает объектам значения кардинальных чисел, она является собственно количественной шкалой. Свойства шкалы интервалов определяются введением метрики. Метрика — функция, вводящая понятие расстояния между двумя элементами, a, b, множества А. (1) R(a, b) >= 0, причем R(a, b) = 0 тогда и только тогда, когда a = b, то есть R(a, a) = 0; Достаточно нарушения одного из приведенных условий, чтобы принять решение о снижении мощности шкалы - до шкалы порядка или даже шкалы отношений, иначе артефактность (ошибочность) выводов неизбежна. Билет № 9 1. «Цена» получения интервальной шкалы при измерении установки методом Терстоуна. Иншервальность установочной шкалы Терстоуна
Теперь попытаемся обосновать тот факт, что при использовании предложенной Терстоуном техники мы действительно получаем интервальную шкалу. Подведем итог сказанному выше. Напомним, что мы сочли возможным считать все оценки-ранги, отвечающие одному суждению, полученными как бы от одного человека. При этом было показано, что соответствующую шкалу можно считать интервальной (за счет осмысленности равенства разностей между рангами). Истинное мнение такого обобщенного человека об указанном суждении отвечает медиане этих суждений, разброс имеет место за счет каких-то случайных флуктуации. Далее мы показали, что медианы разных суждений можно считать полученными по интервальной шкале (поскольку совокупность таких медиан была определена так же, как и совокупность тех рангов, из которых медианы получались, — с точностью до структуры интервалов между ними). При этом фактически было доказано более общее положение ("теорема"): если у нас имеется ряд распределений случайных величин, все значения которых можно считать полученными по одной и той же интервальной шкале, то совокупность медиан этих распределений тоже можно считать полученной по интервальной шкале. Совокупность медиан суждений, отмеченных каким-либо одним респондентом, при его опросе на третьем этапе построения шкалы, мы также считаем случайным образом разбросанными оценками того, что мы ищем, — значения изучаемой установки этого респондента. Медиана этих оценок — шкальное значение респондента. Каждому респонденту отвечает свой "разброс". Таким образом, совокупность итоговых шкальных значений наших респондентов — это совокупность медиан распределений случайных величин, значения которых в свою очередь являются полученными по интервальной шкале медианами. Интервальность этой шкалы вытекает из сформулированной выше "теоремы". Резюмируя все сказанное выше, можно заметить, что в качестве дополнительных предположений об изучаемой ЭС (тех, которые служат заменой непосредственного измерения сложных отношений, отображение которых в числа требуется для получения интервальной шкалы, см. п. 3.1) в данном случае фигурируют все сделанные выше предположения о свойствах ответов наших респондентов: об однородности совокупности экспертов; о равенстве расстояний между суждениями, отнесенными к соседним ячейкам; о неоднозначности совокупности рангов, приписанных разным суждениям одним респондентом, и т.д. Перейдем к рассмотрению метода построения оценочной шкалы, основанного на схожих предположениях. Идея метода также принадлежит Терстоуну 2. Недостаточность формализма репрезентационной теории измерений для решения проблемы измерения в социологии. 14.2. Недостатки формализма РТИ[1] и пути их преодоления Приведенные выше формальные положения РТИ, с одной стороны, продвигают нас вперед в понимании того, что есть измерение в гуманитарных науках (мы уходим от необходимости иметь единицу измерения либо эмпирическую операцию сложения, допускаем возможность использования "неполноценных" чисел и т.д.), но, с другой, далеко не всегда могут удовлетворить социолога. В настоящем параграфе мы покажем, в чем именно состоят недостатки описанного формализма с точки зрения запросов социологии. Однако ради объективности сразу заметим, что тот же подход потенциально содержит и возможность преодоления этих недостатков. Для этого нужно перестать "зашоривать" себя числами, необходимостью описания ЭС(эмпирическая система) строго формальными средствами и т.д. Надо как бы выйти на более широкий простор, начать понимать измерение как моделирование реальности с помощью любых логико-математических конструкций. Итак, чем же нам может мешать понимание измерения как гомоморфизма ЭСО(эмпирическая система с отношениями) в ЧСО(числовая система с отношениями)? 14.2.1. Эмпирические отношения, нё подлежащие О нечисловых измерениях в социологии мы уже говорили в п. 1.5. К сказанному там добавим еще один пример — шкалы Кумбса из главы 10. Напомним, что эти шкалы предусматривают, в частности, наличие в ЭС отношения частичного порядка для оцениваемых объектов. Нетрудно видеть, что такие отношения никак не могут гомоморфно отображаться в ЧС (выше мы в качестве адекватных моделей таких систем называли алгебраические решетки). Заметим, что большинство авторов, использующих нечисловые методы, сами не говорили о том, что используют нечисловые измерения. Свою задачу они видели в предложении метода формализации рассматриваемого явления и способа изучения его на базе этой формализации. Но нам представляется, что упомянутую формализацию естественно понимать именно как измерение. Можно сказать, что измерение — это четкая формулировка тех социальных фактов, на базе которых социолог собирается строить свои выводы. Целесообразность такого подхода косвенно подтверждается тем, что математическая статистика, в своем классическом варианте рассчитанная на числовые случайные величины, в последние годы начинает рассматривать и нечисловые конструкты (об этом мы уже говорили в п. 4.1 применительно к номинальным данным). 14.2.2. Неформализуемые эмпирические системы Не все ЭС можно описать в виде СО. Иногда не надо и стремиться к такому описанию и вообще к полной формализации представлений об ЭС (во всяком случае, при настоящем уровне развития науки). Могут представиться разные варианты (иногда "пересекающиеся") соответствующих ситуаций. а) Некоторые интересующие социолога ЭС могут задаваться аксиоматически. Подчеркнем, что здесь мы не имеем в виду, скажем, упомянутую выше аксиоматику Гельдера, формально описывающую свойства аддитивной ЭС. Эти аксиомы ведут свое происхождение не от социологии. Они позволяют четко понять, что такое классическое измерение — частный и не самый актуальный для социолога подход. Однако в литературе имеются и попытки формализовать, выразить в виде определенных аксиом процесс оценки человеком каких-либо объектов. Так, в работе [Хайниш, Власов, 1980] предпринимается попытка формализации рассуждений, осуществляемых экспертом (лицом, принимающим решение, — ЛПР) в процессе упорядочения им группы объектов. На основе анализа хода размышлений разных экспертов формулируется ряд формальных положений (аксиом), которым удовлетворяет поведение ЛПР в процессе принятия решения. Эти аксиомы одновременно и являются частью описания ЭС, и задают правила перехода от ЭС к ЧС. А вот описание ЭС в виде ЭСО здесь явно отсутствует. Соответственно речь не идет и о математически строгом гомоморфном отображении. Упомянутые аксиомы не носят строго математического характера. Тем не менее важность таких подходов для социолога представляется очевидной. В данном случае — хотя бы для разработки систем принятия решений. Подкрепим свои слова цитатой из работы, посвященной соответствующим проблемам. "Даже весьма общие и схематические модели, если они учитывают какие-то черты фактически протекающих поисков разумных решений... содержат пусть скромное, но приближение к "здравому смыслу" субъектов решений и в силу этого приемлемы для психологических теорий принятия решений и выработки ею нормативных рекомендаций по улучшению актов выбора и поведения, совершаемых личностями и группами людей" [Бирюков, Тихомиров, 1979, с. 477]. Добавим, что все сказанное имеет непосредственное отношение к проблеме измерения в социологии: подобный анализ процессов принятия решения экспертами может привести нас к совершенствованию социологических методов шкалирования. Определенная аксиоматика использовалась и в упомянутой в п. 1.5 деонтической логике. Систему аксиом, как известно, предлагал Дж.Хоманс, строя свою дедуктивную теорию социального обмена [Фотев, 1994]. Проблеме аксиоматического задания ЭС большое внимание уделяют западные ученые, работающие в области РТИ [Scott, Suppes, 1958; Adams et al, 1970]. б) Многие социологические ЭС при нынешнем состоянии науки не могут быть формализованы. Ярким примером являются те ЭС, которые мы фактически имели в виду, когда обсуждали шкалы Кумбса в главе 11. Так, ясно, что зависимость ответа респондента от формулировки обращенного к нему вопроса явно может считаться своеобразным свойством изучаемой ЭС. Если речь идет о построении оценочной шкалы, то элементами этой системы являются оцениваемые объекты, отношения между ними определяются сравнительной значимостью этих объектов для рассматриваемого респондента. Но, пытаясь строить соответствующую МС на базе ответов этого респондента, мы вынуждены усложнить понятие изучаемой ЭС, включив в нее плохо изученное сложное переплетение интересующих нас мнений респондента с его реакцией на внешние свойства анкеты, и т.д. Вероятно, более четкое определение того, какова здесь ЭС, может быть дано только после серьезного социально-психологического изучения соответствующих механизмов. К той же категории по существу принадлежат ЭС, отображаемые практически всеми теми шкалами, которые мы рассматривали в разделе 2. Ведь везде предусматривалась адекватность реальности определенной модели восприятия (порождения данных), отнюдь не являющейся полностью формализованной. Отнюдь не всегда поддаются формализации и свойства ЭС, определяющиеся теми соотношениями между ее элементами, которые связаны со смыслом решаемой задачи, концептуальными гипотезами исследователя и, в частности, характером модели явления, "заложенной" в математическом методе, использование которого планируется (п. 1.3 — признаки-приборы; п. 1.4 — обусловленность интерпретации данных предполагаемыми методами их анализа; см. также п. 3.1). Как мы уже отмечали, недостатки РТИ, обусловленные перечисленными моментами, в значительной мере могут быть преодолены за счет обобщения понятия измерения. Перейдем к обсуждению этого вопроса.
Билет № 10 1. Сбор данных методом парных сравнений. Его преимущества и недостатки по сравнению с методами прямых оценок объектов. Итак, метод парных сравнений — это метод построения оценочной шкалы. Вариант, предложенный Терстоуном, представлял собой довольно узкий подход к шкалированию. Но в настоящее время соответствующие идеи, будучи расширенными, привели к созданию довольно мощной ветви прикладной статистики [Адлер, Шмерлинг, 1978; Дэвид, 1978]. Здесь мы имеем иллюстрацию к упомянутому в п. 3.3 положению: содержательные (здесь — социально-психологические) идеи, будучи четко сформулированными (с использованием математического языка), дали толчок развитию соответствующей математической теории, которая затем начала возвращаться в содержательную область, породившую исходные идеи. Прежде чем описывать метод, необходимо сказать несколько слов о термине "метод ПС". Дело в том, что в литературе он используется в двух смыслах: в узком и широком. Коротко рассмотрим, в чем здесь дело. Строго говоря, метод ПС — это метод получения исходных данных, метод своеобразного опроса респондентов. Этот метод будет описан нами в п. 6.1. Соответствующее использование ин-тересущего нас термина отвечает его узкому смыслу. На базе полученных данных можно решать разные задачи, совсем необязательно включающие в себя построение оценочной шкалы. Построение такой шкалы — это лишь одна из возможных задач. В литературе то же самое название (метод ПС) употребляется также для обозначения широкого круга методов, включающих в себя не только упомянутый выше метод сбора данных, но и способы построения на его основе оценочной шкалы. Такое использование термина отвечает определенному нами широкому смыслу, который отражен в основном в п. 6.2.
6.1. ПС как метод сбора данных
6.1.1. Содержание метода. Свойства получаемых матриц
Выше мы говорили о недостатках, с которыми сопряжено получение оценочной шкалы на базе либо прямых числовых оценок респондентами шкалируемых объектов, либо ранжировок. В психологии показано, что большего доверия заслуживает несколько иной метод сбора данных — так называемый метод парных (попарных) сравнений шкалируемых объектов. Суть его состоит в следующем. Предположим, что нас интересует, как респонденты изучаемой совокупности оценивают какие-либо объекты — профессии, политических лидеров, радиопередачи, какие-то виды товаров и т.д. Обозначим эти объекты через а/; a2, .. ., αη(η — количество оцениваемых объектов). Рассматриваемый метод позволяет получить ответ на этот вопрос в довольно своеобразном виде. Каждому респонденту предлагаются всевозможные пары, составленные из рассматриваемых объектов. Он должен относительно каждой пары сказать, какой объект из этой пары ему нравится больше. Скажем, в случае рассмотрения в качестве наших объектов некоторых профессий — к примеру, токаря, пекаря, лекаря и т.д. — мы спрашиваем у каждого респондента, какая профессия ему больше нравится: токарь или пекарь (фиксируем ответ), токарь или лекарь (фиксируем ответ), пекарь или лекарь (фиксируем ответ) и т.д. для всех возможных пар рассматриваемых объектов. Полученные таким образом данные обычно сводятся в квадратную матрицу из 0 и 1, число строк и столбцов которой равно числу рассматриваемых объектов и элементы которой получаются следующим образом: на пересечении г'-й строки иу'-го столбца такой матрицы стоит 1, если i-Pi объект нравится рассматриваемому респонденту больше, чем у'-й, и стоит 0, если, напротив, у'-й объект респонденту более симпатичен, чем /-й (вместо выражения "больше нравится" здесь, в зависимости от задачи, могут фигурировать словосочетания "больше", "красивее", "более престижен", "больше подходит" и т.д.). Будем называть такую матрицу матрицей парных сравнений. Ниже вместо выражений типа "объект а. лучше объекта а" будем использовать выражение "а > а". В общем виде матрицу для респондента г, (I = 1, ..., N, где N — количество респонден тов) обозначим через ||δ '||, где
1, если респондент η сказал, что а; > я ,
О, если респондент η сказал, что а. < а . В качестве примера такой матрицы см. табл. 6.1.
Таблица 6.1. Пример матрицы парных сравнений, полученной от одного респондента По главной диагонали матрицы нами проставлены крестики, поскольку мы считаем, что сам с собой объект не сравнивается. Нетрудно проверить, что суть отраженной с помощью этой матрицы информации обусловливает некоторые формальные свойства матрицы. Во-первых, она должна быть асимметричной: если на пересечении /'-й строки и у'-го столбца стоит 1 (0), то на пересечении у'-й строки и /-го столбца должен стоять 0(1). Мы видим, что это свойство выполняется для матрицы, изображенной на рис. 6.1. Так, на пересечении первой строки и последнего столбца у нас стоит 1. Это означает, что первый объект нравится нашему респонденту больше, чем последний. В таком случае естественно ожидать, что последний объект будет ему нравиться меньше, чем первый, и, следовательно, на пересечении последней строки и первого столбца матрицы должен стоять 0, что и имеет место. Во-вторых, матрица должна удовлетворять условию транзитивности: если некий объект aj нравится респонденту больше, чем а;, а а. больше, чем ак, то естественно ожидать, что объект а будет ему нравиться больше, чем ак. Так, на нашем рисунке можно видеть, что первый объект нравится рассматриваемому респонденту больше второго (на пересечении первой строки и второго столбца стоит 1), а второй — больше последнего (на пересечении второй строки с последним столбцом* стоит 1). Естественно ожидать, что первый объект будет нравиться респонденту больше, чем последний, что и отражает матрица, поскольку в ней на пересечении первой строки и последнего столбца стоит 1. В то, что результаты парных сравнений заслуживают большего доверия, чем, скажем, ранжировка, можно поверить: встав на точку зрения респондента, нетрудно понять, что проранжи-ровать все объекты иногда бывает весьма трудно, в то время как попарно их сравнить гораздо легче. Метод ПС дает результаты, иногда весьма отличные от метода ранжирования. Мы неоднократно проводили эксперименты со студентами-социологами: с некоторым разрывом во времени просили их сначала попарно сравнить некие объекты, а потом про-ранжировать их же. Результаты весьма отличались друг от друга (и это — для будущих профессионалов, рефлексирующих по поводу того, что они делают, что же ожидать от "простых" респондентов, далеких от науки?). Более того, много раз оказывалось невозможным на базе парных сравнений построить ранжировку. Ниже, в п. 6.1.3, мы рассмотрим возможные причины возникновения такой ситуации. 2. Шкалы, промежуточные между номинальной и порядковой. «Неполноценный» порядок (частичное упорядочение, нарушение условия транзитивности). Не факт, что то
|