Однофакторный дисперсионный анализ

⇐ ПредыдущаяСтр 9 из 38Следующая ⇒

Во многих областях практической деятельности встречаются объекты исследования, состояние которых определяется входными переменными (факторами), не имеющими количественного описания. Такими факторами могут быть неуправляемые и управляемые переменные, которые по каким-либо причинам не позволяют производить их измерение в данном эксперименте, а также те неконтролируемые переменные, уровни варьирования которых можно произвольно выбирать и фиксировать во времени. Для изучения влияния факторов подобного рода на выходную функцию объекта (отклик), их общего оценивания, ранжирования и выделения среди них существенных, очевидно, непригодны все методы отсеивания управляемых количественных факторов и метод регрессионного анализа неуправляемых факторов, поскольку эти методы предусматривают измерение уровней исследуемых факторов.

Рассмотрим теперь постановку задачи в общем виде.

Дано:

– отклик Y может зависеть (по физическим причинам) от k независимых управляемых факторов X₁, X₂,…X_k, не имеющих количественного описания, и их парных взаимодействий;

– каждый фактор X_i может варьироваться на m уровнях;

– полный факторный эксперимент состоит из N серий независимых наблюдений по числу всех возможных неповторяющихся сочетаний k факторов:

– каждая j-ая серия содержит n_j наблюдений Y_j₁, Y_j₂, … параллельных опытов.

Требуется: определить, в какой мере существенно на фоне случайных погрешностей влияние того или иного фактора X_i или взаимодействия факторов на отклик Y; провести сравнение с другими факторами и выделить наиболее существенные.

Допущения, на которых базируется дисперсионный анализ:

– наблюдение отклика Y – нормально распределенная случайная величина с центром распределения M{Y}. Таким образом, факторы определяют величину Y лишь в среднем, оставляя простор для случайных ошибок наблюдений, подчиняющихся нормальному распределению;

– дисперсия единичного наблюдения, обусловленная случайными ошибками, постоянна во всех опытах и не зависит от X₁, X₂,…X_k.

Из данных задачи и указанных допущений очевидно, что чем больше влияние некоторого фактора X_i на отклик Y, тем больше расхождение между собой средних арифметических отклика в сериях параллельных наблюдений, сделанных при различных уровнях варьирования фактора X_i . Статистическая значимость такого расхождения указывает на существенное влияние фактора. Требуется одновременно сопоставить произвольно большое число средних и на основании этого сделать вывод о существенности влияния того или иного фактора.

Из множества факторов, влияющих на рассеяние выходной величины Y, выбирается один, который, по мнению исследователя, имеет наибольшее влияние на это рассеяние. Остальные факторы служат фоном (ошибкой эксперимента). Чтобы выявить эффект исследуемого фактора, его делят на несколько четко разделимых уровней, а остальные факторы рандомизируют. Число экспериментов при этом может быть случайным или определенным по специальной методике из условия минимальной различимости эффектов. Продолжительность экспериментальных исследований должна быть достаточной для того, чтобы учесть все факторы, влияющие на рассеяние выходной величины. По результатам наблюдений и с учетом рандомизации строится таблица наблюдений и первоначальной обработки результатов эксперимента (таблица 3.1), причем число наблюдений по разным уровням исследуемого фактора может быть разным. По данным таблицы вычисляются оценки дисперсии, связанные с изменением уровней исследуемого фактора, то есть дисперсия между выборками , и ошибки эксперимента, то есть дисперсия внутри выборки . Эти формулы представлены в таблице 3.2.

Таким образом, сумма квадратов отклонений SS_общ и общее число степеней свободы N-1 делятся на две составляющие. Одна составляющая основана на дисперсии частных средних вокруг общего среднего X, а другая – на дисперсиях внутри выборок.

Таблица 3.1 – Результаты наблюдений однофакторного эксперимента

Номер наблюдения	Уровни фактора
		…	j	…	k
	y₁₁	y₁₂	…	y_1j	…	y_1k
	y₂₁	y₂₂	…	y_2j	…	y_2k
…	…	…		…		…
i	y_i1	y_i2	…	y_ij	…	y_ik
…	…	…		…		…
n	y_n1	y_n2	…	y_nj	…	y_nk
Суммы	Y_i1	Y_i2	…	Y_ij	…	Y_ik
Число наблюдений	n₁	n₂	…	n_j	…	n_k
Средние			…		…
Квадраты сумм			…		…		Y²

Таблица 3.2 – Схема определения дисперсий

Источник дисперсии	Сумма квадратов	Число степеней свободы	Дисперсия
Внутри выборок
Между выборками		ν₁=k-1
Общая

Если на выборочные наблюдения не оказывают влияния определенные факторы, то обе оценки дисперсий не отличаются друг от друга. Это можно проверить с помощью F-критерия (критерия Фишера), а именно

F= / . (3.1)

По таблице F-распределения (таблица А2 приложения А) находим значение F_кр для выбранного уровня значимости β и числа степеней свободы ν₁=k–1 и ν₂=N–k. Если F_расч<F_кр, то делается вывод о том, что результаты эксперимента не противоречат гипотезе об отсутствии эффекта уровней исследуемого фактора. Если F_расч≥F_кр, то следует сделать вывод о том, что исследуемый фактор вносит существенный эффект в разброс выходной величины Y.

Дисперсионный анализ более эффективно применять при значительном объеме выборки, так как в этом случае удается выделить даже слабый сигнал (влияние фактора) на фоне шума (ошибка эксперимента). Дисперсионный анализ можно использовать и при оценке нескольких факторов (как правило, не более трех) – двух- и трехфакторный дисперсионные анализы. В этом случае удается оценить влияние или его отсутствие не только самих факторов, но и их взаимодействий.

Дата добавления: 2015-08-05; просмотров: 317; Мы поможем в написании вашей работы!; Нарушение авторских прав

⇐ Предыдущая 4 5 6 7 8910 11 12 13 Следующая ⇒

lektsii.com - Лекции.Ком - 2014-2026 год. (0.028 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты