![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Типичная постановка вопроса при использовании различных методов анализа
При кластерном анализе определяют факторы, по которым одни группы потребителей сильно отличаются от других, таким образом, один кластер изолируется от других вследствие «внутреннего сцепления» (рис. 3). Кластеры, представленные большей плотностью точек, могут быть нанесены на двухкоординатную плоскость. Таким образом, идентифицируются группы и сегменты, имеющие некоторые общие характеристики (возраст, нужды, положение и т.д.). Особенно важна эта техника для сегментации рынка, сначала при определении переменных, по которым возникает дифференциация, а затем при дифференциации выборок исследований. Следует также упомянуть о принципе исследований «по выборке». Основа его состоит в получении информации о всей популяции по сравнительно небольшой выборке из нее. Размер выборки определяет точность полученных результатов. Классический метод создания исследуемой выборки - случайный отбор. Для исследований потребителей обычно используется список избирателей, из которого набирается выборка по случайным цифрам или «каждый первый». Объем выборок обычно порядка нескольких сотен или тысяч человек (например, для Англии обычно берется около 30000, т.е. примерно тысячная часть взрослого населения). При принятии нормального закона распределения среднеквадратичное отклонение определяется так:
где p - процент популяции, имеющий признак, подлежащий измерению; n - объем выборки. Рис. 3. Типичные результаты кластерного анализа
Например, при включении в выборку 10000 домовладельцев, выяснилось, что 10% из них соответствуют измеряемому признаку. В этом случае
Это означает, что с вероятностью 68% (одно стандартное отклонение) можно утверждать, что результат лежит между 9,7 и 10,3%, а при допустимой вероятности 0,95 - между 9,4 и 10,6% (два Очевидно, что абсолютный уровень ошибки - наивысший при p=50%, например, при n = 400, допустимой вероятности правильного ответа 0,95 Собранные статистические данные могут анализироваться различным образом, например, с использованием многомерного регрессионного анализа, факторного анализа, кластерного анализа и анализа связей . Таблица. 3.
|