КАТЕГОРИИ:

Астрономия Биология География Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Механика Образование Охрана труда Педагогика Политика Право Психология Риторика Социология Спорт Строительство Технология Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Анализ главных компонент. Вычислительная процедура.

⇐ ПредыдущаяСтр 5 из 16Следующая ⇒

Пусть имеется множество, состоящее из N объектов. Каждый объект описывается с помощью n переменных (признаков, факторов). Совокупность значений переменных сведена в матрицу:

, (10.1)

в которой наблюдения представлены в виде отклонений от выборочных средних, иначе говоря, центрированы, т.е. , ,

где – среднее значение j-й переменной, – результат измерения j-го признака на i-м объекте.

От исходного вектора признаков

перейдем к новому множеству переменных .

Каждую компоненту вектора z будем представлять в виде некоторой линейной комбинации исходных признаков, т.е. , j=1,2,…,n, (10.2)

где – вектор искомых весовых коэффициентов.

На компоненты вектора z наложим следующее требование: первая переменная должна быть ориентирована по направлению максимально возможной дисперсии, вторая − по направлению максимально возможной дисперсии в подпространстве, ортогональном первому направлению, и т.д. Компоненты вектора z, удовлетворяющие этому требованию, называют главными компонентами.

Вычисление главных компонент Вычисление весовых коэффициентов будем проводить последовательно, начиная с первой главной компоненты. Значение первой главной компоненты для i-го объекта (i=1,2,…,N) составит . (10.3)

Вводя векторное обозначение , выражение (10.3) можно записать в виде . (10.4)

Оценка дисперсии D(z₁) центрированной переменной есть по определению среднее квадрата ее значений. Таким образом, . (10.5)

есть не что иное, как оценка матрицы ковариаций исходных признаков . Эту оценку обозначим . Выражение (10.5) примет вид: . (10.5а)

Вектор параметров необходимо подобрать так, чтобы дисперсия D(z₁) была максимальной. Если на параметры не накладывать никаких ограничений, то, очевидно, такая задача не имеет конечного решения. Потребуем, чтобы норма (длина) вектора , равнялась единице: . (10.6)

Для максимизации (10.5а) при ограничении (10.6) воспользуемся методом неопределенных множителей Лагранжа. Определим ,

где – множитель Лагранжа.

Дифференцирование по отдельным элементам вектора компактно может быть записано так:

. Полагая , получаем . (10.7)

Из (10.7) видно, что – собственный вектор матрицы , соответствующий собственному значению λ₁.

Из (10.6) и (10.7) следует, что .

Поскольку максимизируется, в качестве выбирается наибольшее собственное значение матрицы .

При поиске значений элементов вектора , кроме ограничения на норму вектора, аналогичного (10.6), требуется обеспечить ортогональность векторов значений первой и второй главных компонент и . Так как скалярное произведение ортогональных векторов равняется нулю, а матрица симметричная и, следовательно, , то справедлива следующая цепочка равенств:

Поскольку ни (N-1), ни l нулю не равны, имеем: . (10.8)

Определим функцию Лагранжа следующим образом: ,

где λ₂ и – множители Лагранжа.

Приравняем нулю частную производную φ по : .

Умножая последнее равенство слева на и принимая во внимание условие нормировки (10.6), получаем: .

Учитывая, что , а также условие (10.8), имеем: .

Следовательно, соотношение (10.8) примет вид ,

где в качестве выбирается второе по величине собственное значение матрицы ^.Этот процесс продолжается до тех пор, пока не исчерпается список всех n собственных значений матрицы . Полученные в результате n собственных векторов матрицы составят ортогональную матрицу: .

В итоге, значения главных компонент задаются матрицей: .

Ковариационная матрица главных компонент есть .

Введем диагональную матрицу собственных значений

Тогда , и окончательное выражение для ковариационной матрицы главных компонент приобретает вид , поскольку в силу ортогональности собственных векторов.

Следовательно, главные компоненты попарно некоррелированы, а их дисперсии совпадают с собственными значениями ковариационной матрицы исходных переменных.

Если ранг матрицы Х меньше n , то у матрицы будет k нулевых собственных значений, и изменения в переменных могут быть полностью выражены с помощью n-k независимых переменных. При отсутствии нулевых собственных значений некоторые могут оказаться весьма близкими к нулю, так что существенный вклад в суммарную дисперсию будут вносить первые несколько главных компонент.

Суммарная дисперсия исходных переменных, равная следу матрицы , равняется суммарной дисперсии главных компонент. Действительно, .

Здесь мы воспользовались свойством неизменности следа произведения матриц при перестановке сомножителей, т.е. tr(AB)=tr(BA) (предполагается, что произведение ВА существует). Тогда отношения

, ,…, ,

характеризуют пропорциональный вклад каждого вектора, представляющего главные компоненты, в суммарную дисперсию исходных переменных.

Накопленные отношения

показывают относительную долю в суммарной дисперсии исходных переменных, которая приходится на первые k главных компонент. Задавшись некоторым порогом , для дальнейшего анализа оставляют те первые k΄ главных компонент, для которых .

В заключение сделаем два замечания.

1. Переход к главным компонентам наиболее естественен и эффективен, когда исходные признаки имеют общую физическую природу и измерены в одних и тех же единицах. Если это условие не имеет место, то результаты иcследования с помощью главных компонент будут существенно завиcеть от выбора масштаба и природы единиц измерения. В качестве практического средства в таких ситуациях можно рекомендовать переход к вспомогательным безразмерным признакам нормированием исходных признаков по формуле где – дисперсия i-го признака.

2. Аналитически доказано, что переход от исходного n-мерного пространства к m-мерному пространству главных компонент сопровождается наименьшими искажениями суммы квадратов расстояний между всевозможными парами точек наблюдений, расстояний от точек наблюдений до их общего центра тяжести, а также углов между прямыми, соединяющими всевозможные пары точек наблюдений с их общим центром тяжести

Дата добавления: 2015-01-19; просмотров: 105; Мы поможем в написании вашей работы!; Нарушение авторских прав

⇐ Предыдущая 1 2 3 456 7 8 9 10 Следующая ⇒

lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты