КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Анализ главных компонент. Вычислительная процедура.Пусть имеется множество, состоящее из N объектов. Каждый объект описывается с помощью n переменных (признаков, факторов). Совокупность значений переменных сведена в матрицу:
в которой наблюдения представлены в виде отклонений от выборочных средних, иначе говоря, центрированы, т.е. где От исходного вектора признаков перейдем к новому множеству переменных Каждую компоненту вектора z будем представлять в виде некоторой линейной комбинации исходных признаков, т.е. где На компоненты вектора z наложим следующее требование: первая переменная Вычисление главных компонент Вычисление весовых коэффициентов будем проводить последовательно, начиная с первой главной компоненты. Значение первой главной компоненты Вводя векторное обозначение Оценка дисперсии D(z1) центрированной переменной
Вектор параметров Для максимизации (10.5а) при ограничении (10.6) воспользуемся методом неопределенных множителей Лагранжа. Определим где Дифференцирование
Из (10.7) видно, что Из (10.6) и (10.7) следует, что Поскольку При поиске значений элементов вектора
Поскольку ни (N-1), ни l нулю не равны, имеем: Определим функцию Лагранжа следующим образом: где λ2 и Приравняем нулю частную производную φ по Умножая последнее равенство слева на Учитывая, что Следовательно, соотношение (10.8) примет вид где в качестве В итоге, значения главных компонент задаются матрицей: Ковариационная матрица главных компонент есть Введем диагональную матрицу собственных значений Тогда Следовательно, главные компоненты попарно некоррелированы, а их дисперсии совпадают с собственными значениями ковариационной матрицы исходных переменных. Если ранг матрицы Х меньше n , то у матрицы Суммарная дисперсия исходных переменных, равная следу матрицы Здесь мы воспользовались свойством неизменности следа произведения матриц при перестановке сомножителей, т.е. tr(AB)=tr(BA) (предполагается, что произведение ВА существует). Тогда отношения
характеризуют пропорциональный вклад каждого вектора, представляющего главные компоненты, в суммарную дисперсию исходных переменных. Накопленные отношения показывают относительную долю в суммарной дисперсии исходных переменных, которая приходится на первые k главных компонент. Задавшись некоторым порогом В заключение сделаем два замечания. 1. Переход к главным компонентам наиболее естественен и эффективен, когда исходные признаки имеют общую физическую природу и измерены в одних и тех же единицах. Если это условие не имеет место, то результаты иcследования с помощью главных компонент будут существенно завиcеть от выбора масштаба и природы единиц измерения. В качестве практического средства в таких ситуациях можно рекомендовать переход к вспомогательным безразмерным признакам 2. Аналитически доказано, что переход от исходного n-мерного пространства к m-мерному пространству главных компонент сопровождается наименьшими искажениями суммы квадратов расстояний между всевозможными парами точек наблюдений, расстояний от точек наблюдений до их общего центра тяжести, а также углов между прямыми, соединяющими всевозможные пары точек наблюдений с их общим центром тяжести
|