КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Типичная постановка вопроса при использовании различных методов анализа
При кластерном анализе определяют факторы, по которым одни группы потребителей сильно отличаются от других, таким образом, один кластер изолируется от других вследствие «внутреннего сцепления» (рис. 3). Кластеры, представленные большей плотностью точек, могут быть нанесены на двухкоординатную плоскость. Таким образом, идентифицируются группы и сегменты, имеющие некоторые общие характеристики (возраст, нужды, положение и т.д.). Особенно важна эта техника для сегментации рынка, сначала при определении переменных, по которым возникает дифференциация, а затем при дифференциации выборок исследований. Следует также упомянуть о принципе исследований «по выборке». Основа его состоит в получении информации о всей популяции по сравнительно небольшой выборке из нее. Размер выборки определяет точность полученных результатов. Классический метод создания исследуемой выборки - случайный отбор. Для исследований потребителей обычно используется список избирателей, из которого набирается выборка по случайным цифрам или «каждый первый». Объем выборок обычно порядка нескольких сотен или тысяч человек (например, для Англии обычно берется около 30000, т.е. примерно тысячная часть взрослого населения). При принятии нормального закона распределения среднеквадратичное отклонение определяется так:
, где p - процент популяции, имеющий признак, подлежащий измерению; n - объем выборки. Рис. 3. Типичные результаты кластерного анализа
Например, при включении в выборку 10000 домовладельцев, выяснилось, что 10% из них соответствуют измеряемому признаку. В этом случае . Это означает, что с вероятностью 68% (одно стандартное отклонение) можно утверждать, что результат лежит между 9,7 и 10,3%, а при допустимой вероятности 0,95 - между 9,4 и 10,6% (два ). Если n = 400, то границы результата - 7-13% (стандартное отклонение 1,5%). Поэтому часто принимают необходимый объем выборки в 1000 респондентов (см. табл. 3). Очевидно, что абсолютный уровень ошибки - наивысший при p=50%, например, при n = 400, допустимой вероятности правильного ответа 0,95 =2,5% и границе действительных результатов 45-55%. Иными словами, чем меньше ясно респондентам решение (50/50 - наихудший вариант), тем меньше точность. В этих случаях надо увеличивать выборку (увеличение выборки в два раза приводит к увеличению точности в раза). Еще раз следует подчеркнуть, что эти оценки справедливы для действительно случайной выборки. Собранные статистические данные могут анализироваться различным образом, например, с использованием многомерного регрессионного анализа, факторного анализа, кластерного анализа и анализа связей . Таблица. 3.
|