КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Основные статистические характеристики исходных данных. Вычисление основных статистических характеристик ИСД.
Важным способом "описания" переменной является форма ее распределения, которая показывает, с какой частотой значения переменной попадают в определенные интервалы. Нас интересует, насколько точно экспериментальное распределение случайных чисел можно аппроксимировать нормальным распределением. Простые описательные статистики дают об этом некоторую информацию. Первоначальное самое общее представление о распределении случайных величин может быть получено на основе анализа их основных статистических характеристик. Будем обозначать и называть их так, как это принято в пакете Statistica 6.0. Среднее – среднее арифметическое значение (оценка математического ожидания): ; , где n – количество учитываемых временных интервалов; N – количество производственно-экономических факторов; K – количество результативных показателей эффективности; V – общее количество факторов внешней среды; L – общее количество тарифных факторов; vij – значение j–й переменной на i–ом временном интервале; – среднее арифметическое значение j–той переменной по n экспериментальным значениям; i – номер строки в таблице ИСД; j – номер столбца в таблице ИСД. Далее во всех формулах данного раздела используются одни и те же обозначения переменных, что применялись выше, поэтому нет необходимости их дальнейшего пояснения. Стандартное отклонение (оценка среднего квадратического отклонения) – это мера того, насколько широко распределены экспериментальные данные относительно их среднего значения: ; . Дисперсия, квадрат среднего квадратического отклонения даёт величину дисперсии : ; . Стандартная ошибка среднего – отношение стандартного отклонения к корню квадратному из количества учитываемых временных интервалов: ; . Медиана – это число, которое является серединой совокупности случайных чисел, то есть половина случайных чисел имеют значения, меньшие, чем медиана, а другая половина чисел имеют значения, большие, чем медиана. Асимметрия характеризует степень несимметричности распределения относительно его среднего. Для нормального закона асимметрия равна нулю. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение в сторону отрицательных значений. Оценка асимметрии вычисляется по формуле: ; .
Стандартная ошибка асимметрии: , где n – количество учитываемых временных интервалов. Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Для нормального распределения эксцесс равен нулю. Положительный эксцесс соответствует относительно остроконечному распределению. Отрицательный эксцесс соответствует относительно сглаженному распределению: ; .
Средняя ошибка эксцесса: , где n – количество учитываемых временных интервалов. Вычисленные по формулам статистические характеристики приведены в таблице 5, в которой вычислены следующие показатели: - кол-во данных – количество экспериментальных данных; - среднее – среднее значение; - медиана; - разница между медианой и средним значением; - станд. ошибка – стандартная ошибка; - минимум – минимальное значение; - максимум – максимальное значение; - дисперсия выборки; - станд. откл. – стандартное отклонение; - ассим. – ассиметричность; - станд. ош. ассим. – стандартная ошибка ассиметричности; - эксцесс; - станд. ош. эксцесса – стандартная ошибка эксцесса.
Основные статистические характеристики ИСД представлены в таблице5. Таблица 5
7.Проверка «нормальности» Нормальный закон является наиболее употребительным. Он применяется для представления самых различных случайных процессов, таких, как продолжительность жизни людей, изменения экономических и технических показателей. Выскажем гипотезу, что исходные статистические данные подчинены нормальному закону, и в качестве параметров нормального закона примем оценки математического ожидания и среднего квадратического отклонения, вычисленные по формулам. Функция плотности нормального закона имеет вид: ; . Так как в нашем случае количество реализаций переменных сравнительно невелико, то для оценки предположения о нормальности принимаем критерий Колмогорова – Смирнова, используемый в пакете прикладных программ (ППП) Statistica 6.1. ; ; , где F*(vij) – эмпирическая функция распределения j-ой переменной для i-го значения; F(vij) – гипотетическая функция распределения j-ой переменной для i-го значения; dj – абсолютная величина разности между эмпирической и гипотетической функциями распределения. Значения гипотетической функции распределения находятся по статистическим таблицам [9]. ; ; . Если коэффициент доверия Pк предположению о нормальности эмпирического распределения, который можно найти по статистическим таблицам, не меньше 0,20, то предположение о нормальности не отвергается. Если Рк <0,20, то предположение о нормальности рекомендуется отвергнуть. Соответствие эмпирического и гипотетического распределений можно визуально проследить по графикам. При использовании критерия согласия Колмогорова предпочтительнее использовать функции распределения. Такие графики строятся и выдаются в специальных программных процедурах ППП Statistica 6.1 и Excel 2007 , на которые производится ориентация вычислений по излагаемому математическому аппарату. Графики определения нормальности ИСД для распределений случайных величин представлены на рис.3.-8.
Рис.3. Эмпирическая и гипотетическая функция распределения X1
Рис.4. Эмпирическая и гипотетическая функция распределения X2
Рис.5. Эмпирическая и гипотетическая функция распределения X3
Рис.6. Эмпирическая и гипотетическая функция распределения У1
Рис.7. Эмпирическая и гипотетическая функция распределения У2
Рис.8. Эмпирическая и гипотетическая функция распределения У3
Для анализа «нормальности» исходных статистических данных применен критерий согласия Колмогорова – Смирнова. Результаты представлены в таблице 6 Коэффициент доверия найден по статистическим таблицам.
Таблица 6
В 5 случае из 21, что составляет 24% ИСД соответствуют нормальному распределению по критерию Колмогорова-Смирнова. Из этого следует, что при увеличении количества учитываемых временных интервалов количество распределений, подчиненных нормальному закону, уменьшится.
|