КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Кластерный анализМетод кластерного анализа позволяет строить классификацию п объектов посредством объединения их в группы или кластеры на основе критерия минимума расстояния в пространстве т переменных, описывающих объекты. Метод позволяет находить разбиение множества объектов на заданное число кластеров. Кластерный анализ носит количественный характер, но статистические пакеты обычно не предлагают методов проверки гипотезы об адекватности получаемых классификаций. Исходные данные для кластерного анализа представляются в виде матрицы размером т х п, содержащей информацию одного из следующих трех типов: · измерения X. значений т переменных для п объектов; · квадратная (т = п) матрица расстояний между парами объектов; · квадратная (т - п) матрица близостей для всех пар п объектов. Объектами могут быть товары разных фирм, например легковые автомобили. Переменными могут быть их характеристики, значимые для покупателей. В этом случае кластерный анализ позволяет объективно разделить их на группы и облегчить позиционирование автомобиля предприятия по отношению к конкурентам, обосновать назначение цены. Другим видом объектов могут быть регионы страны. Если в качестве переменных использовать уровень доходов и уровень цен, то можно классифицировать регионы по уровню благосостояния. Можно в качестве переменных взять 32 показателя благосостояния, рекомендуемые ООН, тогда классификация будет всесторонней. На ее основе можно планировать региональную экономическую политику. В ряде статистических пакетов в матрице близостей или в матрице расстояний может быть заполнена лишь левая нижняя половина под диагональю, верхняя половина может быть заполнена нулями. Если исходные данные представляют собой значения т переменных для п объектов, то необходимо выбрать стратегию объединения и метод вычисления расстояния d. между объектами в многомерном пространстве-метрики. Дивизивная стратегия динамических сгущений позволяет сгруппировать объекты в заданное число кластеров. В случае дивизивной стратегии кластеризации необходимо указать число кластеров, на которое желательно разбить множество объектов, причем окончательное количество кластеров может получиться меньше этого числа, если затребованное разбиение для имеющихся данных невозможно. Промежуточным результатом анализа являются среднее внутри кластерное расстояние, по которому можно сравнивать различные варианты кластеризации, и кластеры с указанием в каждый кластер объектов. В случае использования матрицы переменные-объекты можно получить проекции на плоскость каждых двух переменных графика кластеров, на котором объекты каждого кластера соединяются линиями с центральным объектом. Они позволяют наглядно представить характеристики классификации. Промежуточным результатом анализа являются среднее внутри-кластерное расстояние, по которому можно сравнивать различные варианты кластеризации, и кластеры с указанием в каждый кластер объектов. В случае использования матрицы переменные-объекты можно получить проекции на плоскость каждых двух переменных графика кластеров, на котором объекты каждого кластера соединяются линиями с центральным объектом. Они позволяют наглядно представить характеристики классификации.
|