КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Проверка статистических гипотез
При решении многих прикладных задач необходимые вероятностные характеристики соответствующих случайных величин неизвестны исследователю и должны определяться по экспериментальным данным. Такое статистическое описание результатов наблюдений, построение и проверка различных математических моделей, использующих понятие вероятности, составляют основное содержание математической статистики. Фундаментальными понятиями статистической теории являются понятия генеральной совокупности и выборки. Генеральная совокупность – совокупность всех мыслимых (возможных) результатов наблюдений над случайной величиной, которые в принципе могут быть проведены при данных условиях. Если в результате эксперимента получены значения x1, x2,...xn, то они интерпретируются как случайная выборка из некоторой гипотетической генеральной совокупности. Выборка – это конечный набор значений случайной величины, полученный в результате наблюдений. Число элементов выборки n называется ее объемом. Выборка называется репрезентативной (представительной), если она достаточно полно характеризует генеральную совокупность. Для обеспечения репрезентативности выборки чаще всего используется случайный выбор элементов. Предполагается, что при таком выборе каждая возможная выборка фиксированного объема имеет одну и ту же вероятность выбора, а последовательные наблюдения взаимно независимы. Смысл статистических методов заключается в том, чтобы при выборке ограниченного объема n, то есть по некоторой части генеральной совокупности, высказать обоснованное суждение о ее свойствах в целом. Под статистическими гипотезами понимаются некоторые предположения относительно характера распределения вероятностей генеральных совокупностей и их параметров. По данным выборки можно оценить такие параметры распределения как математическое ожидание (часто называемое также средним значением) и дисперсию. Математическое ожидание определяется по выражению:
(1.22)
Дисперсию можно оценить с помощью соотношения
(1.23)
Несмещенность оценки s2 достигается использованием в знаменателе формулы (2.2) величины , которую называют числом степеней свободы, вместо очевидного на первый взгляд значения n. Эта величина равна разности между числом имеющихся экспериментальных значений n, по которым вычисляют оценку дисперсии, и количеством дополнительных параметров, входящих в формулу для оценки этой дисперсии и вычисляемых в виде линейных комбинаций тех же самых наблюдений (в данном случае это всего один параметр ). Проверка гипотезы заключается в сопоставлении некоторых статистических показателей (критериев проверки), вычисленных по данным выборки, со значениями этих показателей, определенных теоретически в предположении, что гипотеза верна. Критерий статистической гипотезы – это правило, позволяющее принять или отвергнуть данную гипотезу на основании выборки. Для проверки гипотезы о равенстве двух выборочных средних значений случайной величины, имеющей гауссовский закон распределения, используется критерий Стьюдента (t-критерий). Для применения данного критерия подсчитывают выборочные средние арифметические значения случайной величины x1 и x2, соответственно для выборок n1 и n2 , и их выборочные стандартные отклонения S1 и S2, которые определяются по следующим формулам:
и (1.24)
Далее подсчитывается величина стандартного отклонения выборочных средних арифметических значений по формуле
(1.25)
После того, как определены стандартные отклонения выборочных средних арифметических, подсчитывается размах Стьюдента:
или (1.26)
Найденное экспериментальное значение t сравнивают с критичным значением tкр , которое определяется по таблице распределения Стьюдента для заданного коэффициента риска (обычно задаются =0,10; 0,05; 0,01), при котором может быть принята гипотеза, и числа степеней свободы . Если значение критерия, вычисленного по данным выборки, окажется больше его критического значения, определенного по таблице A1 приложения А, то гипотеза бракуется. При значениях критерия, принадлежащего области допустимых значений, можно лишь сделать заключение, что данная выборка не противоречит гипотезе. То есть если t tкр, то гипотеза о равенстве выборочных средних арифметических значений принимается, а это значит, что выборки взяты из одной и той же генеральной совокупности. При гауссовском законе распределения случайной величины для проверки гипотезы о равенстве двух дисперсий одной и той же случайной величины, в качестве критерия значимости используется критерий Фишера (F- критерий), который равен отношению двух рассматриваемых выборочных дисперсий S1 и S2 , имеющих соответственно степени свободы 1 и 2 , то есть
(1.27)
При расчете F–параметра по (2.6) должно выполняться условие S21 >S22. В противном случае следует поменять местами рассматриваемые дисперсии. Найденное экспериментальное значение F-парметра сравнивается с его критическим значением Fкр, соответствующим максимальному значению отношения двух дисперсий, при котором еще можно считать гипотезу о равенств рассматриваемых дисперсий справедливой. Критичное значение Fкр по числу степеней свободы и заданному коэффициенту риска находится из таблицы A2 приложения А, Значение числа степеней свободы 1 дисперсии, стоящей в числителе выражения (1.27), определяет значение Fкр по столбцу, а значение 2 – по строке. Если F Fкр, то гипотеза о равенстве выборочных дисперсий принимается. В противном случае, рассматриваемые дисперсии относятся к различным генеральным совокупностям исследуемой случайной величины. Для проверки однородности дисперсии полученных экспериментальных значений используют критерий Кохрена. Для этого рассчитывается дисперсия экспериментальных значений для каждой выборки. В результате получится ряд выборочных дисперсий S2 и недоверие будут вызывать именно наибольшие их значения. Далее подсчитывается параметр
(1.28)
при i=1,2…N, то есть вычисляют отношение максимального значения изменчивости среди N опытов к сумме изменчивостей во всех N опытах. Найденное по (1.28) наибольшее экспериментальное значение G сравнивают с критичным его значением Gкр. Критичное значение отношения рассматриваемой изменчивости к сумме всех изменчивостей находят из таблицы критических значений критерия Кохрена (таблица A3 приложения А). Задаваясь определенным значением коэффициента риска β, Gкр определяют в столбце, соответствующем числу элементов выборки (n) и строке, соответствующей числу выборок (N). Если G Gкр, то “подозрительное” максимальное значение изменчивости не является “инородным”, а представляет собою результат случайного рассеивания исследуемой величины. Критерий Кохрена применяется для оценки однородности дисперсий только при равном числе повторов каждого эксперимента, что и имеет место при применении методов статистического планирования и проведения эксперимента. Если число повторов различно (различные объемы выборок), то однородность дисперсий проверяется по критерию Бартлета. Соответствие экспериментального распределения случайной величины предполагаемому теоретическому закону распределения оценивается с помощью критерия Пирсона. Принадлежность случайной величины к рассматриваемой генеральной совокупности случайных величин позволяет оценить критерий Диксона. Применение этого критерия имеет практический смысл только при большом числе параллельных опытов. Наиболее часто применимы на практике для проверки статистических гипотез критерии Стьюдента, Фишера, Кохрена. Рассмотрим их применение на примерах.
|