КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Выборочная дисперсия.⇐ ПредыдущаяСтр 11 из 11 Выборочная совокупность(выборка)-это, совокупность случайно отобранных объектов. Пусть из генеральной совокупности извлечена выборка, причем x1 наблюдалось n1 раз, x2-n2 раз и - объем выборки. Наблюдаемые значения xi наз. вариантами, а последовательность вариантов, записанных в возрастающем порядке,- Вариационным рядом. Выборочная средняя - наз. среднее арифметическое значение признака выборочной совокупности. Если все значения x1,x2,x3,..,xn признака выборки объема n различны, то Если значения x1,x2,x3,..,xn имеют частоты n1,n2,…,nk, то Выборочной дисперсией - наз. среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если все значения x1,x2,x3,..,xn признака выборки объема n различны, то Если значения x1,x2,x3,..,xn имеют частоты n1,n2,…,nk, то
38. Эмпирическая функция распределения и ее свойства. Гистограмма и полигон. Эмпирической функцией распределенияназ. функцию , определяющую для каждого значения x относительную частоту события X<x. ; - число вариантов, меньших х; n- объем выборки. Св-ва: 1)значение эмпирической функции принадлежит отрезку [0,1]; 2)неубывающая функция; 3)если х1 – наименьший вариант, то =0 при х<=x1; если хk –наибольший вариант, то =1 при х>xk; Полигономчастот наз. ломанную, отрезки которой соединяют точки (х1;n1), (х2;n2) и т.д. Для построения полигона частот откладывают варианты xi на оси абсцисс, а на оси ординат- соответствующие им частоты ni. Полигон относительных частот. На оси абсцисс откладываем варианты xi, а на оси ординат соответствующие им относительные частоты. В случае непрерывного признака целесообразно построить гистограмму. Гистограммой наз. ступенчатую фигуру, состоящую из прямоугольников , основаниями которой служат частичные интервалы длиною h , а высоты равны отношению ni/h. 39. Статистические оценки параметров распределения и требования к ним. Пусть требуется оценить количественный признак генеральной совокупности. Допустим нам удалось установить какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение. Например, если наперед известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить мат. ожидание и средне квадратичное отклонение, т.к. эти два параметра полностью определяют нормальное распределение. Обычно в нашем распоряжении имеются лишь значения количественного признака x1,x2,…,xn , полученные в результате n наблюдений. Через эти данные и выражается оцениваемый параметр. Рассматривая x1,x2,…,xn как независимые случайные величины Х1,Х2,…,Хn, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значениеоцениваемого параметра. 40.Точечные оценки. Точечной наз.статистическую оценку, которая определяется одним числом. Несмещенной наз. точечную статистическую оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки. Смещеннойназ. статистическую оценку, мат. ожидание которой не равно оцениваемому параметру. Несмещеннойоценкой генеральной средней служит выборочная средняя xi – варианта выборки; i – частота варианты xi; - объем выборки. Смещенной оценкой генеральной дисперсии служит выборочная средняя
Несмещеннойоценкой генеральной дисперсии служит «исправленная дисперсия»
41. Доверительный интервал для математического ожидания при известном Пусть количественный Х генеральной совокупности признак распределен нормально , причем среднее квадратичное отклонение этого распределения известно. Требуется оценить неизвестное математическое ожидание по выборочной средней . Найдем доверительные интервалы покрывающие параметр с точностью . Будем рассматривать выборочную среднюю как случайную величину и выборочные значения признака x1,x2,…,xn - как одинаково распределенные независимые случайные величины X1,X2,…,Xn. Если случайная величины Х распределена нормальна , то выборочная средняя , найденная по независимым наблюдениям , также распределена нормально. Параметры распределения таковы М( )= , ( )= / Должно выполняться соотношение
Пользуясь формулой вычисления вероятности заданного отклонения
заменив Х на и на ( )= / получаем
где Из последнего равенства получаем можно записать Приняв во внимание ,что вероятность Р задана и ровна ,окончательно имеем
Смысл полученного такой : с точностью можно утверждать , что доверительный интервал покрывает неизвестный параметр с точностью оценки
42 Доверительные интервалы для математического ожидания при неизвестном Пусть количественный признак Х генеральной совокупности распределен нормально , причем среднее квадратичное отклонение этого распределения неизвестно. Требуется оценить неизвестное математическое ожидание с помощью доверительных интервалов. Оказывается , что по данным выборки можно построить случайную величину , которая имеет распределение Стьюдента с степенями свободы; здесь - выборочная средняя ,S- «исправленное» среднее квадратическое отклонение, n- объем выборки. Плотность распределения Стьюдента Мы видим , что распределение Стьюдента определяется параметром n – объемом выборки и не зависит от неизвестных параметров и ; эта особенность является его большим достоинством . Поскольку S(t,n) –четная функция от t , вероятность осуществления неравенства определяется так Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим Пользуясь распределением Стьюдента , мы нашли доверительный интервал , покрывающий неизвестный параметр с надежностью . 43. Распределение Стьюдента. Пусть Z- нормальная случайная величина , причем М(Z)=0, (Z)=1, а V- независимая от Z величина , которая распределена по закону с степенями свободы. Тогда величина имеет распределение , которое называют t-распределением или распределением Стьюдента с степенями свободы. Итак, отношение нормированной нормальной величины к квадратному корню из независимой случайной величины , распределенной по закону «хи квадрат» с степенями свободы , деленной на , распределено по закону Стьюдента с степенями свободы. 44 Доверительный интервал для Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение по «исправленному» выборочному среднему квадратическому отклонению s. Нужно найти доверительные интервалы , покрывающие параметр , с точностью . Нам надо ,чтобы выполнялось соотношение или Для того , чтобы можно было пользоваться готовой таблицей, преобразуем двойное неравенство в равносильное неравенство положив Получили искомый доверит. интервал. 45. Выборочное среднее. Выборочной средней - наз. среднее арифметическое значение признака выборочной совокупности. Если все значения x1,x2,x3,..,xn признака выборки объема n различны, то Если значения x1,x2,x3,..,xn имеют частоты n1,n2,…,nk, то
46. Выборочная дисперсия и выборочное среднее квадратическое отклонение. Выборочной дисперсией - наз. среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если все значения x1,x2,x3,..,xn признака выборки объема n различны, то Если значения x1,x2,x3,..,xn имеют частоты n1,n2,…,nk, то
Выборочное среднее квадратическое отклонение-наз. квадратный корень из выборочной дисперсии.
№47. Метод наименьших квадратов При обработке статистических данных часто приходится решать задачу о нахождении зависимости одной СВ от другой, кот. Может быть представлена в виде ф-ции y = f(x). В результате эксперимента может быть получено n экспериментальных пар чисел (xi,yi), i = 1,n. На плоскости можно построить корреляционное поле. Производимые измерения связаны с ошибками случайного характера. На графике имеется разброс относительно общей закономерности. Задача исследований состоит в обработке данных, при которых по возм-ти более точно можно будет определить зависимость x от y. Часто бывает, что вид зависимости известен из опыта или каких-либо физических соображений. Остается определить параметры, входящие в зависимость. Для определения этих параметров применяются различные методы, одним из них является метод наименьш. квадратов. Пусть в результате опыта получено n точек. Вид уравнения регрессии зависит от n параметров y = f(x,a1,a2,…,an). Зависисмость y(x) является аналитической и она может не совпадать с эмпирическими данными, что означает, что Δi = yi - f(xi,a1,a2,…,an) ≠ 0, Требуется определить параметры функции регрессии так, чтобы сумма квадратов разности Bi быланаименьшей: .Функция z зависит от n параметров, которые нужно определять. Они находятся из условия , составляется система, находим a1,a2,…,an . Критерий согласия Пирсона. Правила: Для того чтобы при заданном уровне значимости α проверить гипотезу о том, что совокупность Х распределена нормально требуется: 1) Вычислить ХВ и σВ; 2) Вычислить теоретические частоты , где и , где n – объем выборки, h – шаг группировки 3) Сравнить эмпирические и теоретические частоты: a. Составить расчетную таблицу, по которой наблюдаемое значение критерия b. По таблице критических точек распределения χ2 по заданному уровню значимости α и числу степеней свободы k, S – число групп выборки, k=S-3, находят χ2критич. 4) Если χ2критич > χ2набл, то нет оснований отвергнуть гипотезу, а если наоборот, то гипотеза отвергается. №49. Критерий Колмагорова. (λ-критерий) В критерии Колмагорова сравниваются эмпирические и теоретические функции распределения. λ-критерий предполагает, что значение параметров гипотетической функции распределения известны. λ-критерий применяется при уровне значимости от 0.1 до 0.2. Проверку гипотезы H0 проводят по следующей схеме: 1) Составляют из результатов наблюдения интервальный статистический ряд; 2) Находят эмпирическую функцию распределения ; 3) Находят для каждого значения x величину ; 4) Определяют выборочное значение статистики Колмагорова . Колмагоров показал, что выборочная статистика имеет функцию распределения такого вида: . Функция Колмагорова имеет вид . Это распределение называется распределением Колмагорова. Зададим уровень значимости α из соотношения . Определим λα квантели распределения Колмагорова из таблицы
Если , то H0 отклоняется, если - нет оснований отклонить гипотезу. №50 и №51. Уравнение (прямой) регрессии. Пусть по корреляционному полю или по физическому смыслу определен вид функции регрессии y = ax+b , a, b – неизвестны. Определим их с помощью метода наименьших квадратов. Составим разность: Решая систему получим: Разделив кажд. ур-е на n получим некотор. цел. зн-я: Тогда уравнение регрессии y на x примет вид: Аналогич. можно получ. ур-е регрессии x на y: Ур-я (1) и (2) проходят через точку , но не совпадают. Совпадают при rВ = 1. №53 и №54. Коэффициенты линейной регрессии: Из нахождения коэффициентов a и b для уравнения регрессии y на x: ; - корреляционный момент; , где rxy – выборочный коэффициент корреляции, , где Kxy – корреляционный момент, он же центральный момент порядка 1+1 ν11 1. Пространство элементарных событий. Алгебра событий. 2. Классическое, геометрическое и статистическое определение вероятности. 3. Теоремы сложения и умножения вероятностей независимых событий. 4. Теоремы сложения и умножения вероятностей совместных событий. 5. Формула полной вероятности. 6. Формула Байеса. 7. Интегральная функция распределения вероятностей и ее свойства. 8. Плотность распределения вероятностей и ее свойства. 9. Математическое ожидание (МО) случайной величины (СВ) и его свойства. 10. Дисперсия СВ и ее свойства. 11. Среднеквадратические отклонения СВ и его свойства. 12. Равномерное распределение вероятностей СВ. 13. Показательное распределение вероятностей СВ 14. Биномиальное распределение вероятностей СВ 15. Пуассоновское распределение вероятностей СВ. 16. Нормальное (Гаусса) распределение вероятностей СВ. 17. Функция Лапласа и ее свойства. 18. Предельные теоремы Муавра-Лапласа. 19. Схема Бернулли. Формула Бернулли. 20. Наивероятнейшее число появления сообщения. Формула Пуассона. 21. Вероятность отклонения случайной величины от МО. Правило трех сигм. 22. Неравенство Чебышева. 23. Теорема Чебышева. 24. Теорема Бернулли. 25. Предельная теорема Ляпунова (без доказательства). 26. МО и дисперсия числа появления события в n независимых испытаниях. 27. Начальные и центральные моменты СВ и их вычисление. 28. Вероятность попадания СВ, распределенной нормально в заданный интервал. 29. Системы 2-х случайных величин и законы их распределения. 30. Функция и плотность распределения системы 2-х СВ и их свойства. 31. Условная функция и условная плотность распределения СВ. 32. Вероятность попадания случайной точки в прямоугольник и произвольную область. 33. Числовые характеристики системы непрерывных СВ: МО, дисперсия и моменты. 34. Числовые характеристики системы 2- х непрерывных СВ: МО, дисперсия и моменты. 35. Числовые характеристики системы 2-х дискретных СВ: МО, дисперсия и моменты. 36. Корреляционный момент СВ и его свойства. 37. Выборочная совокупность. Вариационный ряд. Выборочное среднее, выборочная дисперсия 38. Эмпирическая функция распределения и ее свойства. Полигон, гистограмма. 39. Статистические оценки параметров распределения и требования к ним. 40. Точечные оценки. 41. Доверительный интервал для математического ожидания при известном а. 42. Доверительный интервал для математического ожидания при неизвестном а. 43. Распределение Стьюдента. 44. Доверительный интервал для а. 45. Выборочное среднее. 46. Выборочная дисперсия и выборочное среднее квадратическое отклонение. 47. Метод наименьших квадратов. 48. Критерий согласия Пирсона 49. Критерий Колмагорова. 50. Уравнение регрессии. 51. Уравнение прямой регрессии. 52. Корреляционное отношение и его свойства. 53. Коэффициент линейной регрессии. 54. Выборочный коэффициент корреляции ( выражение его через коэффициент регрессии
|