КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Построение эмпирической функции распределения и гистограммыПолагая вероятность каждого значения равной 1/n, получим распределение выборки. Эмпирическая функция распределения или функция распределения выборки тогда будет определяться следующим образом: , (1)
где - объем выборки, - число выборочных значений, меньших х. При большом объеме выборку целесообразно предварительно подвергнуть группировке следующим образом. Построить интервал, содержащий все выборочные значения, левый и правый концы этого интервала – приближенные (с малым числом значащих цифр) значения наименьшего и наибольшего элементов выборки, причем в первом случае приближение берется с недостатком, а во втором – с избытком. Полученный интервал разделить на m равных частей (интервалов), заботясь при этом (для упрощения вычислений) о том, чтобы границы интервалов были числами с малым количеством значащих цифр. Все расчеты удобно оформить в виде таблицы 2. Выбрав число интервалов m = 20 (оно в процессе обработки может быть изменено), обозначим границы . Поместим значения границ в графу 2. Подсчитаем число элементов выборки, попавших в – й интервал. Может случиться, что отдельные значения совпадут со значениями границ некоторых интервалов.
Таблица 1
Таблица 2
В таких случаях поступают различными способами: а) уславливаются все такие элементы совокупности относить либо к правому, либо к левому интервалу; б) эти элементы учитываются и в левом и в правом интервале, полагая, что в каждый интервал попало по 1/2 элемента. Значения поместим в графу 3. Интервалы, в которые попадает малое число элементов (концевые), рекомендуется объединить. Для построения гистограммы желательно, чтобы число элементов в каждом интервале было не меньше 10, а число интервалов не меньше 8. Уточненные границы интервалов поместим в графу 4, а число элементов, попавших в каждый интервал после уточнения границ, в графу 5. Обозначим середины полученных интервалов через и поместим эти значения в графу 7. Замечание. При малом объеме выборки в качестве будет выступать сами выборочные значения, которые поместим в графу 7. При этом графы 2-5 не заполняются. Определим частоту попадания выборочных значений в -й интервал: , (2) где – число элементов, попавших в -й интервал, – объем выборки. Полученные значения поместим в графу 6. Их можно проверить, вычислив сумму частот , где – число уточненных интервалов. Эта сумма должна быть равна единице. Замечание. При малом объеме выборки частота каждого выборочного значения постоянна и равна 1/n . Эмпирическая функция распределения строится как функция распределения выборки , причем значение повторяется раз, раза и т. д. (все элементы исходной выборки, попавшие в – й интервал, заменены на ). Очевидно, что для всех . Таким образом, . (3) Кроме того, при и при .
Значения можно поместить в графу 8. Пример графика эмпирической функции распределения представлен на рисунке 1. Доказано, что эмпирическая функция распределения, построенная по всей выборке, сходится по вероятности к функции распределения генеральной совокупности при . Но и эмпирическая функция распределения, построенная по группированной выборке, дает достаточно хорошее представление о функции распределения генеральной совокупности.
1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1
0,18 0,37 0,55 0,74 0,92 1,29 1,85 2,77 Рисунок 1
Если рассматривается выборка из генеральной совокупности значений непрерывной случайной величины, то можно для более наглядного представления о функции распределения генеральной совокупности построить ломаную, соединив точки (рис. 1, пунктирная линия). Замечание. График эмпирической функции распределения можно построить непосредственно, взяв примерно двадцать идущих подряд элементов исходной (до упорядочения) выборки. Гистограммастроится по группированной выборке следующим образом: над каждым интервалом (графа 4) строим прямоугольник, площадь которого равна частоте попадания в данный интервал, т. е. высота прямоугольника равна частоте, деленной на длину соответствующего интервала (рис. 2).
Н
0,18 0,37 0,55 0,74 0,92 1,29 1,85 2,77 х Рисунок 2
Плавная кривая, проведенная по средним точкам верхних оснований прямоугольников гистограммы для выборки из генеральной совокупности значений непрерывной случайной величины, дает представление о графике плотности распределения генеральной совокупности. Замечание. При построении плавной кривой не следует стремиться проводить ее строго через средние точки оснований, так как число элементов, попадающих в каждый интервал, является случайным, и даже в том случае, когда исследуемая случайная величина строго следует закону распределения, характеризуемому плотностью вероятности , эти точки не совпадут точно с точками теоретической кривой.
|