Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Основные статистические характеристики исходных данных. Вычисление основных статистических характеристик ИСД.




 

Важным способом "описания" переменной является форма ее распределения, которая показывает, с какой частотой значения переменной попадают в определенные интервалы. Нас интересует, насколько точно экспериментальное распределение случайных чисел можно аппроксимировать нормальным распределением. Простые описательные статистики дают об этом некоторую информацию. Первоначальное самое общее представление о распределении случайных величин может быть получено на основе анализа их основных статистических характеристик. Будем обозначать и называть их так, как это принято в пакете Statistica 6.0.

Среднее – среднее арифметическое значение (оценка математического ожидания):

; ,

где n – количество учитываемых временных интервалов;

N – количество производственно-экономических факторов;

K – количество результативных показателей эффективности;

V – общее количество факторов внешней среды;

L – общее количество тарифных факторов;

vij – значение j–й переменной на i–ом временном интервале;

– среднее арифметическое значение j–той переменной по n экспериментальным значениям;

i – номер строки в таблице ИСД;

j – номер столбца в таблице ИСД.

Далее во всех формулах данного раздела используются одни и те же обозначения переменных, что применялись выше, поэтому нет необходимости их дальнейшего пояснения.

Стандартное отклонение (оценка среднего квадратического отклонения) – это мера того, насколько широко распределены экспериментальные данные относительно их среднего значения:

; .

Дисперсия, квадрат среднего квадратического отклонения даёт величину дисперсии :

; .

Стандартная ошибка среднего – отношение стандартного отклонения к корню квадратному из количества учитываемых временных интервалов:

; .

Медиана – это число, которое является серединой совокупности случайных чисел, то есть половина случайных чисел имеют значения, меньшие, чем медиана, а другая половина чисел имеют значения, большие, чем медиана.

Асимметрия характеризует степень несимметричности распределения относительно его среднего. Для нормального закона асимметрия равна нулю. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение в сторону отрицательных значений. Оценка асимметрии вычисляется по формуле:

; .

 

Стандартная ошибка асимметрии:

,

где n – количество учитываемых временных интервалов.

Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Для нормального распределения эксцесс равен нулю. Положительный эксцесс соответствует относительно остроконечному распределению. Отрицательный эксцесс соответствует относительно сглаженному распределению:

;

.

 

Средняя ошибка эксцесса:

,

где n – количество учитываемых временных интервалов.

Вычисленные по формулам статистические характеристики приведены в таблице 5, в которой вычислены следующие показатели:

- кол-во данных – количество экспериментальных данных;

- среднее – среднее значение;

- медиана;

- разница между медианой и средним значением;

- станд. ошибка – стандартная ошибка;

- минимум – минимальное значение;

- максимум – максимальное значение;

- дисперсия выборки;

- станд. откл. – стандартное отклонение;

- ассим. – ассиметричность;

- станд. ош. ассим. – стандартная ошибка ассиметричности;

- эксцесс;

- станд. ош. эксцесса – стандартная ошибка эксцесса.

 

 

Основные статистические характеристики ИСД представлены в таблице5.

Таблица 5

 

7.Проверка «нормальности»

Нормальный закон является наиболее употребительным. Он применяется для представления самых различных случайных процессов, таких, как продолжительность жизни людей, изменения экономических и технических показателей.

Выскажем гипотезу, что исходные статистические данные подчинены нормальному закону, и в качестве параметров нормального закона примем оценки математического ожидания и среднего квадратического отклонения, вычисленные по формулам.

Функция плотности нормального закона имеет вид:

; .

Так как в нашем случае количество реализаций переменных сравнительно невелико, то для оценки предположения о нормальности принимаем критерий Колмогорова – Смирнова, используемый в пакете прикладных программ (ППП) Statistica 6.1.

;

; ,

где F*(vij) – эмпирическая функция распределения j-ой переменной для i-го значения;

F(vij) – гипотетическая функция распределения j-ой переменной для i-го значения;

dj – абсолютная величина разности между эмпирической и гипотетической функциями распределения.

Значения гипотетической функции распределения находятся по статистическим таблицам [9].

; ; .

Если коэффициент доверия Pк предположению о нормальности эмпирического распределения, который можно найти по статистическим таблицам, не меньше 0,20, то предположение о нормальности не отвергается. Если Рк <0,20, то предположение о нормальности рекомендуется отвергнуть.

Соответствие эмпирического и гипотетического распределений можно визуально проследить по графикам. При использовании критерия согласия Колмогорова предпочтительнее использовать функции распределения. Такие графики строятся и выдаются в специальных программных процедурах ППП Statistica 6.1 и Excel 2007 , на которые производится ориентация вычислений по излагаемому математическому аппарату.

Графики определения нормальности ИСД для распределений случайных величин представлены на рис.3.-8.

 

Рис.3. Эмпирическая и гипотетическая

функция распределения X1

 

Рис.4. Эмпирическая и гипотетическая

функция распределения X2

 

 

Рис.5. Эмпирическая и гипотетическая

функция распределения X3

 

 

Рис.6. Эмпирическая и гипотетическая

функция распределения У1

 

Рис.7. Эмпирическая и гипотетическая

функция распределения У2

 

 

Рис.8. Эмпирическая и гипотетическая

функция распределения У3

 

 

Для анализа «нормальности» исходных статистических данных применен критерий согласия Колмогорова – Смирнова. Результаты представлены в таблице 6 Коэффициент доверия найден по статистическим таблицам.

 

Таблица 6

 

В 5 случае из 21, что составляет 24% ИСД соответствуют нормальному распределению по критерию Колмогорова-Смирнова. Из этого следует, что при увеличении количества учитываемых временных интервалов количество распределений, подчиненных нормальному закону, уменьшится.

 


Поделиться:

Дата добавления: 2015-08-05; просмотров: 126; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты