КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
P(t)³0.Стр 1 из 2Следующая ⇒ Свойства плотности распределения вероятностей непрерывной случайной величины: 1. Плотность распределения – неотрицательная функция: p(t)³0. Геометрически это означает, что график плотности распределения расположен либо выше оси Ох, либо на этой оси. 2. =1. Учитывая, что F(+¥)=1, получаем: =1. Т.е. площадь между графиком плотности распределения вероятностей и осью абсцисс равна единице. Эти два свойства являются характеристическими для плотности распределения вероятностей. Доказывается и обратное утверждение: Любая неотрицательная функция p(t), для которой =1, является плотностью распределения вероятностей некоторой непрерывно распределенной случайной величины. Общий вид графика функции плотности распределения вероятностей непрерывной случайной величины приведен на рисунке:
30. Вероятность попадания случайной величины в заданный интервал. Зная плотность распределения, можно вычислить вероятность попадания значений непрерывной случайной величины в заданный интервал. Вероятность того, что непрерывная случайная величина примет значения, принадлежащие интервалу (a, b), равна определенному интервалу от плотности распределения, взятому в пределах от а до b: P(а£Х<b)= .
Действительно, P(а£Х<b)=F(b) – F(a)= – = по одному из свойств определенного интеграла. Из вышеприведенного утверждения можно сделать вывод, что вероятность того, что непрерывная случайная величина Х примет одно определенное значение, равна нулю. Отсюда, P(a£Х<b)=P(a<Х<b)=P(a<Х£b)=P(a£Х£b)=F(b) – F(a).
Геометрически вероятность попадания значений непрерывной случайной величины в интервал (a, b) может быть рассмотрена как площадь фигуры, ограниченной осью Ох, графиком плотности распределения p(t) и прямыми х=a и х=b.
31. Нахождение функции распределения по известной плотности распределения. Зная плотность распределения F(X), можно найти функцию распределения F(X) по формуле . Действительно, F(X) = P(X < X) = P(-∞ < X < X). Следовательно, . Или . Таким образом, Зная плотность распределения, можно найти функцию распределения. Разумеется, по известной функции распределения можно найти плотность распределения, а именно: F(X) = F'(X). Пример: Найти функцию распределения по данной плотности распределения:
Решение: Воспользуемся формулой Если X ≤ A, то F(X) = 0, следовательно, F(X) = 0. Если A < x ≤ b, то F(x) = 1/(b-a), Следовательно, . Если X > B, то . Итак, искомая функция распределения
32. Вероятностный смысл распределения. Вероятность того, что непрерывная случайная величина примет значение, принадлежащее интервалу , приближенно равна (с точностью до бесконечно малых высшего порядка относительно ) произведению плотности распределения вероятности в точке на длину интервала : 33. Закон равномерного распределения вероятностей. Случайная величина Х называется равномерно распределеннойна отрезке [a, b], если ее плотность распределения вероятностей имеет вид: . График плотности распределения вероятностей равномерно распределенной случайной величины представлен на рисунке.
34. Числовые характеристики непрерывных случайных величин. Пусть непрерывная случайная величина Х задана функцией распределения f(x). Допустим, что все возможные значения случайной величины принадлежат отрезку [a,b]. Математическим ожиданиемнепрерывной случайной величины Х, возможные значения которой принадлежат отрезку [a,b], называется определенный интеграл Если возможные значения случайной величины рассматриваются на всей числовой оси, то математическое ожидание находится по формуле: Дисперсией непрерывной случайной величины называется математическое ожидание квадрата ее отклонения. По аналогии с дисперсией дискретной случайной величины, для практического вычисления дисперсии используется формула: Средним квадратичным отклонениемназывается квадратный корень из дисперсии. МодойМ0 дискретной случайной величины называется ее наиболее вероятное значение. Для непрерывной случайной величины мода – такое значение случайной величины, при которой плотность распределения имеет максимум. Если многоугольник распределения для дискретной случайной величины или кривая распределения для непрерывной случайной величины имеет два или несколько максимумов, то такое распределение называется двухмодальным или многомодальным. Если распределение имеет минимум, но не имеет максимума, то оно называется антимодальным. Медианой MD случайной величины Х называется такое ее значение, относительно которого равновероятно получение большего или меньшего значения случайной величины. Геометрически медиана – абсцисса точки, в которой площадь, ограниченная кривой распределения делится пополам. Отметим, что если распределение одномодальное, то мода и медиана совпадают с математическим ожиданием. Начальным моментомпорядка k случайной величины Х называется математическое ожидание величины Хk. Начальный момент первого порядка равен математическому ожиданию. Центральным моментомпорядка k случайной величины Х называется математическое ожидание величины Центральный момент первого порядка всегда равен нулю, а центральный момент второго порядка равен дисперсии. Центральный момент третьего порядка характеризует асимметрию распределения.
Отношение центрального момента третьего порядка к среднему квадратическому отклонению в третьей степени называется коэффициентом асимметрии. Для характеристики островершинности и плосковершинности распределения Абсолютный центральный момент первого порядка называется средним арифметическим отклонением 35. Нормальное распределение, его математическое ожидание, дисперсия. Случайная величина называется распределенной по нормальному закону, если ее плотность вероятности имеет вид: Здесь математическое ожидание, дисперсия, среднее квадратическое отклонение. Как и ранее, , однако, этот интеграл вычисляется численными методами. Чтобы упростить эту процедуру, пользуются преобразованием случайной величины и правилом сохранения элемента вероятности , где плотность распределения вероятности случайной величины : . Как видим, индивидуальные числовые характеристики распределения (математическое ожидание и дисперсия) в последнее выражение не входят, т.е. вышеуказанным преобразованием нормальная случайная величина приведена к нормальной стандартной случайной величине с параметрами 0 (математическое ожидание) и 1 (дисперсия). Дифференциальная и интегральная функции стандартного нормального распределения табулированы (имеются таблицы), что существенно облегчает вычисления. Интегральная функция распределения обозначается , Часто используют функцию Лапласа: Очевидны следующие свойства:
где . Пример. Нормальная случайная величина задана математическим ожиданием и средним квадратическим отклонением . Записать соответствующую дифференциальную функцию, схематично изобразить ее график, вычислить вероятность попадания случайной величины в интервал
Решение: Записать дифференциальную функцию нормальной случайной величины с заданными значениями математического ожидания и дисперсии значит в общее выражение для дифференциальной функции нормальной случайной величины подставить заданные и . Например, если , то получим . При изображении этой функции на схематичном графике следует учесть, что эта функция имеет максимум при , симметрична относительно (это видно непосредственно из приведенной выше формулы) и стремится к нулю при . Однако правило (вероятность того, что случайная величина примет значение, по модулю отличающееся от математического ожидания на или более, пренебрежимо мала – составляет всего около 0,0027) позволяет нам закончить правую ветвь в точке а левую – в точке Высота максимума в точке составит Дополнительно надо учесть, что перегибы ветвей будут иметь место в точках Вероятность попадания случайной величины в интервал вычислим так: При этом следует воспользоваться таблицами функции стандартного нормального распределения или функции Лапласа .
36. Нормальная кривая. Центральная предельная теорема. Если случайная величина Х представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то Х имеет распределение, близкое к нормальному. Говорят, что случайная величина Х распределена по нормальному закону с параметрами а и , если плотность распределения вероятностей имеет вид: , –¥<t<¥. Вероятностный смысл параметров а и таков: а – математическое ожидание случайной величины Х, s – среднее квадратическое отклонение величины. Иногда такой закон распределения называют Гауссовским. График плотности нормального распределения называют нормальной кривой (кривой Гаусса). На рисунке изображены нормальные кривые с параметрами а=1 и , , . Из рисунка видно, что положение пика кривых определяется параметром а=1, а параметр s (среднее квадратическое отклонение) характеризует форму нормальной кривой. При увеличении s уменьшается максимум кривой распределения, сама кривая становится более пологой, растягиваясь вдоль оси абсцисс. И, наоборот, при уменьшении s возрастает максимум кривой распределения, сама кривая становится более «островершинной». Площадь, ограниченная любой нормальной кривой и осью абсцисс, равна единице. Параметр а(математическое ожидание величины) определяет положение максимума на оси абсцисс, не влияя на форму кривой. На рисeyrt ниже показаны нормальные кривые с одинаковым средним квадратическим отклонением и разными математическими ожиданиями а=–1, а=0, а=1.
Нормальное распределение с параметрами а=0 и называется нормированным.
36. Вероятность попадания в заданный интервал нормальной случайной величины. Вероятность того, что Х примет значение, принадлежащее интервалу (α,β) P(α<X<β)=Ф((β-a)/σ)-Ф((α-a)/σ), где – функция Лапласа. 1. Ф(-∞)=0 2. Ф(+∞)=1 3. Ф(-х)=1-Ф(х) P(mx-l<x<mx+l)=Ф(l/σ)-Ф(-l/σ)=2Ф(l/σ)-1
38. Вычисление вероятности заданного отклонения. Часто требуется вычислить вероятность того, что отклонение нормально распределенной случайной величины Х по абсолютной величине меньше заданного положительного числа d, т. е. требуется найти вероятность осуществления неравенства |x —а|<d. Заменим это неравенство равносильным ему двойным неравенством Тогда получим: Приняв во внимание равенство: (функция Лапласа—нечетная), окончательноимеем Вероятность заданного отклонения равна На рисунке наглядно показано, что если две случайные величины нормально распределены и а = 0, то вероятность принять значение, принадлежащее интервалу (-d,d),больше у той величины, которая имеет меньшее значение d. Этот факт полностью соответствует вероятностному смыслу параметра s . Пример. Случайная величина Х распределена нормально. Математическое ожидание и среднее квадратическое отклонение Х соответственно равны 20 и 10. Найти вероятность того, что отклонение по абсолютной величине будет меньше трех. Решение: Воспользуемся формулой По условию , тогда
39. Правило трех сигм. Если случайная величина распределена нормально, то абсолютная величина ее отклонения от мат. ожидания не превосходит утроенного среднего квадратического отклонения.
Запишем вероятность того, что отклонение нормально распределенной случайной величины от математического ожидания меньше заданной величины D:
Если принять D = 3s, то получаем с использованием таблиц значений функции Лапласа:
Т.е. вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю.
40. Генеральная и выборочная совокупность. Повторная и бесповторная выборки. Статическое распределение выборки. Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов. Генеральной совокупностью называют совокупность объектов, из которых производится выборка. Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Пример: если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N = 1000, а объем выборки n =100. Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. На практике обычно пользуются бесповторным случайным отбором. Статистическим (эмпирическим) законом распределения выборки, или просто статистическим распределением выборки называют последовательность вариант хi и соответствующих им частот ni или относительных частот wi. Статистическое распределение выборки удобно представлять в форме таблицы распределения частот, называемой статистическим дискретным рядом распределения:
(сумма всех частот равна объему выборки ∑ni=n)
(сумма всех относительных частот равна единице ∑wi=1).
41. Понятие о системе случайных величин. Если возможное значение случайной величины определяется одним числом, то она называется одномерной. Например, число очков, выпадающее при бросании кости (дискретная одномерная случайная величина), или, расстояние от орудия до места падения снаряда (непрерывная одномерная случайная величина). Кроме одномерных случайных величин изучают величины, возможные значения которых определяются двумя, тремя, ..., n числами. Такие величины называются соответственно двумерными, трехмерными, . . ., n-мерными. Двумерную случайную величину обозначают (X, Y). Каждую из величин Xи Yназывают составляющей; обе величины Xи Y, рассматриваемые одновременно, образуют систему двух случайных величин. Аналогично n-мерную величину можно рассматривать как систему п случайных величин.
42. Функция распределения двумерной случайной величины. Функцией распределения вероятностей системы двух случайных величин называется функция двух аргументов , равная вероятности совместного выполнения двух неравенств и , т. е.
Свойства функции распределения системы двух случайных величин: 1) Если один из аргументов стремится к + бесконечности, то функция распределения системы стремится к функции распределения одной случайной величины, соответствующей другому аргументу. 2) Если оба аргумента стремятся к бесконечности, то функция распределения системы стремится к единице. 3) При стремлении одного или обоих аргументов к - бесконечности функция распределения стремится к нулю. 4) Функция распределения является неубывающей функцией по каждому аргументу. 5) Вероятность попадания случайной точки (X, Y) в произвольный прямоугольник со сторонами, параллельными координатным осям, вычисляется по формуле.
. Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если все значения x1, х2, …, xn признака выборки объема п различны, то . Если же значения признака x1, х2, …, xk имеют соответственно частоты п1, n2,…, nk,причем n1 + n2+…+nk = n, то , т.е. выборочная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам. Пример.Выборочная совокупность задана таблицей распределения xi 1 2 3 4 ni 20 15 10 5 Найти выборочную дисперсию. Решение. Найдем выборочную среднюю (см. § 4): . Найдем выборочную дисперсию: .
Выборочным средним квадратическим отклонением (стандартом)называют квадратный корень из выборочной дисперсии: .
54. Формула для вычисления дисперсии. Теорема.Дисперсия равна среднему квадратов значений признака минус квадрат общей средней: . Доказательство. Справедливость теоремы вытекает из преобразований: . Итак, , где , . Пример.Найти дисперсию по данному распределению xi 1 2 3 4 ni 20 15 10 5 Решение.Найдем общую среднюю: . Найдем среднюю квадратов значений признака: . Искомая дисперсия =5-22=1.
55. Точность оценки, доверительная вероятность (надежность). Доверительный интервал. Точечнойназывают оценку, которая определяется одним числом. Все оценки, рассмотренные выше,- точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т. е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками. Интервальнойназывают оценку, которая определяется двумя числами - концами интервала. Интервальные оценки позволяют установить точность и надежность оценок (смысл этих понятий выясняется ниже). Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ. Будем считать Θ постоянным числом (Θ может быть и случайной величиной). Ясно, что Θ* тем точнее определяет параметр Θ, чем меньше абсолютная величина разности |Θ - Θ*|. Другими словами, если δ>0 и |Θ - Θ*|<δ, то чем меньше δ, тем оценка точнее. Таким образом, положительное число δ характеризует точность оценки. Однако статистические методы не позволяют категорически утверждать, что оценка Θ * удовлетворяет неравенству |Θ - Θ*|<δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется. Надежностью (доверительной вероятностью)оценки Θ по Θ* называют вероятностьγ,с которой осуществляется неравенство |Θ - Θ*|<δ. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999. Пусть вероятность того, что |Θ - Θ*|<δ, равна γ: Р[|Θ - Θ*|<δ]= γ. Заменив неравенство |Θ - Θ*|<δ равносильным ему двойным неравенством -δ <Θ - Θ*< δ, или Θ*- δ <Θ< Θ* + δ, имеем Р[Θ* - δ <Θ< Θ* + δ] = γ. Это соотношение следует понимать так: вероятность того, что интервал(Θ*-δ, Θ*+δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ. Доверительнымназывают интервал (Θ*-δ, Θ*+δ), который покрывает неизвестный параметр с заданной надежностью γ.
56. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ. Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью γ. Будем рассматривать выборочную среднюю как случайную величину ( изменяется от выборки к выборке) и выборочные значения признака х1, x2, ...,хn - как одинаково распределенные независимые случайные величины Х1, Х2, ...,Хn (эти числа также изменяются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно а и среднее квадратическое отклонение - σ. Примем без доказательства, что если случайная величина X распределена нормально, то выборочная средняя ,найденная по независимым наблюдениям, также распределена нормально. Параметры распределения таковы : M( )=a, . Потребуем, чтобы выполнялось соотношение Р(|Х - а| < δ) = γ, где γ - заданная надежность. Пользуясь формулой Р(|Х-а| < δ) = 2Ф(δ/σ), заменив X на и σ на , получим Р(|Х-а|) <δ) = 2Ф(δ ) = 2Ф (t), где t = δ . Найдя из последнего равенства , можем написать Р (| —а | < ) = 2Ф(t). Приняв во внимание, что вероятность P задана и равна γ, окончательно имеем (чтобы получить рабочую формулу, выборочную среднюю вновь обозначим через )
Смысл полученного соотношения таков: с надежностью γ можно утверждать, что доверительный интервал ( , ) покрывает неизвестный параметр а; точность оценки . Итак, поставленная выше задача полностью решена. Укажем еще, что число t определяется из равенства 2Ф(t) = γ. или Ф(t)= γ /2; по таблице функции Лапласа (см. приложение 2) находят аргумент t, которому соответствует значение функции Лапласа, равное γ /2.
57. Условные варианты. Предположим, что варианты выборки расположены в возрастающем порядке, т. е. в виде вариационного ряда. Равноотстоящиминазывают варианты, которые образуют арифметическую прогрессию с разностью h. Условныминазывают варианты, определяемые равенством ui=(xi-C)/h, где С—ложный нуль (новое начало отсчета); h — шаг, т. е. разность между любыми двумя соседними первоначальными вариантами (новая единица масштаба). Упрощенные методы расчета сводных характеристик выборки основаны на замене первоначальных вариант условными. Покажем, что если вариационный ряд состоит из равноотстоящих вариант с шагом h, то условные варианты есть целые числа. Действительно, выберем в качестве ложного нуля произвольную варианту, например хт, Тогда . Так как i и m-целые числа, то их разность i-m = иi-также целое число. Замечание 1. В качестве ложного нуля можно принять любую варианту. Максимальная простота вычислений достигается, если выбрать в качестве ложного нуля варианту, которая расположена примерно в середине вариационного ряда (часто такая варианта имеет наибольшую частоту). Замечание 2. Варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю. Пример.Найти условные варианты статистического распределения: Решение. Выберем в качестве ложного нуля варианту 33,6 (этаварианта расположена в середине вариационного ряда). Найдем шаг: h = 28,6 —23,6 = 5. Найдем условную варианту: u1=(xi-C)/h= (23,6 —33,6)/5 = -2. Аналогично получим: u2= - 1, u3 = 0, u4 =1, u5 = 2. Мы видим, что условные варианты — небольшие целые числа. Разумеется, оперировать с ними проще, чем с первоначальными вариантами.
58. Обычные, начальные и центральные моменты. Обычным эмпирическим моментом порядка kназывают среднее значение k-x степеней разностей xi - С: где xi- наблюдаемая варианта, ni- частота варианты, - объем выборки, С - произвольное постоянное число (ложный нуль). Начальным эмпирическим моментом порядка kназывают обычный момент порядка k при С = 0 . В частности, , т, е. начальный эмпирический момент первого порядка равен выборочной средней. Центральным эмпирическим моментом порядка k называют обычный момент порядка k при С = . В частности, , т. е. центральный эмпирический момент второго порядка равен выборочной дисперсии. Легко выразить центральные моменты через обычные: ,
59. Условные эмпирические моменты. Условным эмпирическим моментом порядка kназывают начальный момент порядка k,
|