![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
И ДОСТОВЕРНОСТИ СВЯЗИ. МНОГОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
Теперь перейдем к изучению оценки существенности корреляционного отношения с использованием уровня значимости. Дисперсионный анализ позволяет не только определить роль случайной и систематической вариации в общей вариации, но и оценить достоверность вариации, обнаруженной методом аналитических группировок. Определение достоверности вариации дает возможность с заданной степенью вероятности установить, вызвана ли межгрупповая вариация признаком, положенным в основание группировки, или она является результатом действия случайных причин. Для оценки существенности корреляционного отношения η2 при разных условиях вероятности или значимости α. Уровень значимости – это достаточно малое значение вероятности, отвечающее событиям, которые в данных условиях исследования будут считаться указанием на неправильность начального предположения. Чаще всего пользуются уровнями α=0,05 или α=0,01. Критические значения корреляционного отношения содержатся в специальных таблицах. В этих таблицах распределение η2 при случайных выборках зависит от числа степеней свободы факторной и случайной дисперсий. Число степеней свободы факторной дисперсии K1=m-1, где m-число групп, а для случайной дисперсии K2=n-m, где n-число вариант, m-число групп. В примере №10 рабочие сгруппированы в две группы по числу обслуживаемых станков. Поэтому K1=m-1=2-1-1, а K2=n-m=10-2=8. По специальной таблице приложений можно найти критическое значение η2, соответствующее К1=1 и К2=8 для уровня значимости α=0,05, которое равно: Затем фактическое отношение корреляционного отношения надо сравнить с критическим, табличным. Если оно окажется больше критического, то связь между результативным и факторным признаками считается существенной, если же фактическое значение η2 меньше табличного, то связь между указанными признаками считается несущественной. В рассматриваемом нами примере фактическое значение корреляционного отношения η2=0,931 больше табличного, которое составляет При проверке существенности связи чаще пользуются критерием Фишера, потому что при больших числах степеней свободы его табличные значения мало изменяются в отличие от корреляционного отношения, которое требует более громоздких таблиц. Критерий Фишера представляет собой отношение межгрупповой дисперсии к средней из внутригрупповых дисперсий, исчисленных с учетом числа степеней свободы:
Для этих отношений Р. Фишер (отсюда название «критерий Фишера») составил таблицы, по которым можно определить, какая величина F при данном числе степей свободы по факторной вариации (К1) и остаточной вариации (К2) дает основание утверждать с определенной вероятностью (например, 0,95; 0,99), что положенный в основание группировки признак является существенным, или не дает такого основания, и, следовательно, группировочный признак является несущественным.
В нашем примере 10 …
По правилу сложения вариаций
Исчислим критерий Фишера F
При уровне значимости α=0,05, К1=1 и К2=8 критическое, табличное значение F=5,32. Значит, уже при значении F=5,32 можно с вероятностью 0,95 утверждать, что группировочный признак (число обслуживаемых станков) является весьма существенным. В нашем примере он составляет F=108,1. Тем более есть основание считать, что полученные в результате группировки данные являются вполне достоверными. Можно использовать другой способ расчёта. Зная корреляционное отношение, можно определить критерий Фишера по следующей формуле:
Для примера 10…
Обычно используются две таблицы, позволяющие судить о предельно высокой величине показателя F при доверительных вероятностях 0,05 и 0,01 (5%-ный и 1%- уровень). В таблице, где указана вероятность 0,05, приведены предельные теоретические значения F, которые только в 5 случаях из 100 (соответственно в другой таблице, где указана вероятность 0,01, только в одном случае из 100) могут достигать фактические значения F, если вариация всецело обусловлена только случайными причинами. В таблице с доверительными вероятностями 0,01 соответствующие предельные теоретические значения F выше, чем в таблице с вероятностью 0,05, так как если принимается более высокая доверительная вероятность, то увеличивается и возможное предельное отношение F, обусловленное воздействием на вариацию только случайных факторов. Табличные значения F используются как критерий для оценки фактических значений F, полученных в результате обработки статистического материала. Если Fфакт>Fтеор, то это значит, что очень мала вероятность того, что отношение оценочных дисперсий и, следовательно, вариация признаков обусловлена только случайными факторами. В этом случае есть основание утверждать, что между факторным группировочным признаком и результативным признаком существует взаимосвязь. Когда же Fфакт<Fтеор, это значит, что отношение оценочных дисперсий и вариация групповых средних факторного признака не выходят за пределы возможных случайных колебаний. В таблице значений F в заголовках столбцов и строк указаны степени свободы вариации оценочных дисперсий. В заголовках столбцов приведены степени свободы для большей оценочной дисперсии, а в заголовках строк – для меньшей. На пересечении столбцов и строк, соответствующих степеням свободы сравниваемых оценочных дисперсий, и находится теоретическое значение F, отвечающее величине доверительной вероятности.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
│►11 . Предположим, что имеются 4 группы однотипных станков. Эти группы станков различаются между собой по времени производственной эксплуатации. Стоит задача выяснить, влияет ли в сложившихся условиях период эксплуатации станков на их работу. Показателем, характеризующим работу станков, является выработка одноименных и чаще всего выпускаемых деталей на каждом станке. Для исследования на основе случайного отбора приведены измерения выработки на пяти станках из каждой группы и получены следующие результаты:
второй группы – 9, 10, 10, 5, 6 деталей в час; третьей группы – 9, 11, 8, 7, 10 деталей в час; четвертой группы – 10, 5, 4, 6, 5 деталей в час.
Составим расчетную табл. 12. Таблица 12 Расчетная таблица
Вследствие того, что девиация делится на различное число степеней свободы, то Находим значение критерия F: В соответствии с числом степеней свободы для S21, равным 16, и для S22, равным 3, в таблице для 5%-ного уровня распределения F на пересечении соответствующего столбца и строки находим значение этого показателя Fфакт=8,69, а для 1%-ного уровня распределения Fтеор=26,83. Так как даже для доверительной вероятности 0,05 (5%-ный уровень) Fфакт<Fтеор, следует считать, что длительность эксплуатации станков в сложившихся условиях не влияет на работу станков, на их производительность. Нулевая гипотеза, т.е. то, что межгрупповая вариация производительности станков всецело обусловлена случайными факторами, остается не опровергнутой [8].
Об отсутствии связи между длительностью работы станков и их производительностью свидетельствует низкое значение корреляционного отношения. ◄
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Следует отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценки межфакторного взаимодействия. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования), несомненно, более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие. Необходима оценка достоверности влияния не только каждого положенного в основание группировки фактора в отдельности, но и результата их взаимодействия. Последний определяется как разность между эффектом совместного влияния двух группировочных признаков и суммой эффектов влияния каждого из этих факторных признаков, взятых в отдельности. Это осложняет расчеты суммы квадратов отклонений и числа степеней свободы вариации. Но сам принцип дисперсионного анализа, заключающийся в сопоставлении факторной дисперсии со случайной для оценки достоверности результатов статистической группировки, неизменен при любом числе признаков группировки. В основе применения дисперсионного анализа лежит закон разложения дисперсий признака на составляющие. Общая вариация (D0) результативного признака при группировке может быть разложена на следующие составные части: на межгрупповую (Dм), связанную с группировочными признаками; и на остаточную (внутригрупповую Dв), не связанную с группировочным признаком. Для проведения дисперсионного анализа необходимо установить источники варьирования признака, объем вариации по источникам; определить число степеней свободы для каждой компоненты вариации и дисперсии для каждой составляющей (межгрупповой и внутригрупповой). РЕЗЮМЕ
Аналитические группировки и другие приёмы исследования при всей своей значимости не дают количественного выражения тесноты связи между признаками. Эта задача решается при помощи дисперсионного и корреляционного анализов. Дисперсионный анализ позволяет оценить достоверность вариации, обнаруженной методом аналитических группировок и доказать существенность связей между признаками. В основе применения дисперсионного анализа лежит закон разложения дисперсий признака на составляющие. Связь между общей, межгрупповой и внутригрупповой дисперсиями получила в статистке название закона сложения (разложения) вариации. Для проведения дисперсионного анализа необходимо установить источники варьирования признака, объем вариации по источникам; определить число степеней свободы для каждой компоненты вариации и дисперсии для каждой составляющей (межгрупповой и внутригрупповой). Значимость определяют с помощью критерия Фишера, представляющего собой отношение межгрупповой дисперсии к средней из внутригрупповых дисперсий, исчисленных с учетом числа степеней свободы. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. . В этой главе приведено:
v Общие понятия и цели дисперсионного анализа. v Оценка существенности корреляционного отношения с использованием уровня значимости. v Проверка существенности связи с применением критерия Фишера.
|