Студопедия

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника



Случайная величина. Генеральная совокупность и выборка




Читайте также:
  1. A) совокупность клеток, образующих в таблице область прямоугольной формы
  2. A) Совокупность программных средств, с помощью которых создается база данных и поддерживается в процессе эксплуатации
  3. D) совокупность социальных институтов и норм, посредством которых реализуется политическая власть.
  4. Аудит товарных запасов в оптовых торговых организациях: цель, программа, выборка в аудите, процедуры аудита средств контроля и по существу.
  5. Аудиторская выборка как метод выявления существенных искажений в учете и отчетности.
  6. Аудиторская выборка.
  7. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной.
  8. Военная безопасность Российской Федерации обеспечивается всей совокупностью имеющихся в ее распоряжении сил, средств и ресурсов.
  9. Вопрос 16: Исследования памяти в когнитивной психологии. Память как совокупность процессов приема, трансформации и хранения информации.
  10. Вопрос 3. Совокупность преступлений

Пусть некоторая величина X в ряде испытаний может принимать различные числовые значения. Если значение величины Х в каждом данном испытании не может быть указано заранее (непред­сказуемо), то величина Х называется случайной величиной.

Если случайная величина может принимать бесконечное множе­ство значений, причем эти значения могут быть сколь угодно близ­ки друг к другу, то такая величина называется непрерывной случай­ной величиной. Если же случайная величина может принимать лишь дискретные значения, то она называ­ется дискретной случайной величиной.

Факт при­нятия величиной заранее заданного значения для дискретной случайной величины или попадания в задан­ный интервал для непрерывной случай­ной величины в конкретном испытании является случайным событием, происходящим с определенной вероятностью.

Охарактеризовать случайную величину можно при помощи закона распределения. Под законом распределения случайной величины понимается со­ответствие, устанавливающее связь между возможными значениями случайной величины и вероятностями принятия этих значений. Это соответствие может быть задано в виде таблицы, графика или мате­матической формулы.

В основе любых измерений лежат прямые измерения, в ходе ко­торых находят некоторое числовое значение физической величины. Каждая отдельная измерительная операция (отсчет, замер) называется наблюдением, а получаемое при этом значение физической величины – результатом наблюдения. В связи с тем, что результат отдельного наблюдения включает в себя неизвестные погрешности, для решения поставленной выше задачи нахождения оценки значения физической величины в процессе измерения проводят серию наблюдений. Получаемые в серии результаты наблюдений подвержены как систематическим, так и случайным отклонениям от истинного значения физической величины. Такие заранее непред­сказуемые в каждом данном наблюдении результаты представляют собой случайную величину. Многократное повторное проведение опыта позволяет установить статистические закономерности, которым удовлетворяет данная случайная величина, и найти результат измерения.

При каждом наблюдении мы получаем некоторое возможное значение фи­зической величины. Всё множество значений, которые измеряемая величина может принимать в эксперименте, называется генеральной совокупностью. Это множество может быть как конечным, так и бесконечным. Большинство физических величин имеют непрерыв­ный набор возможных значений, множество которых является беско­нечным. Говорят, что такие величины имеют генеральную совокуп­ность бесконечного объёма.



Генеральная совокупность несет полную информацию об измеряе­мой величине и позволяет (в отсутствие систематичес­ких погрешностей), несмотря на случайный характер результатов от­дельных наблюдений, найти истинное значение x0 физической величи­ны. В случае физической величины с непрерывным набором значений для нахождения истинного значения необходимо провести бесконеч­ное число наблюдений, что невозможно. Поэтому на практике ограни­чиваются конечным числом наблюдений (от единиц до нескольких десятков). Полученный при этом ряд значений физической величины: x1, x2, ..., xN называют выборкой из генеральной совокупности или про­сто выборкой. Число N результатов наблюдений в выборке называют объёмом выборки.

Результаты наблюдений, входящие в выборку, можно упорядо­чить, т. е. расположить их в порядке возрастания или убывания: x1x2 ≤ ... ≤ xN . Полученную выборку называют упорядоченной или ранжированной. Величина R = xmахxmin называется размахом выборки.



2.3. Гистограмма. Эмпирическое распределение
результатов наблюдений

Чтобы получить представление о законе распределения измеряемой величины, экспериментальные данные группируют. Для этого весь интервал значений вели­чины от xmin до xmax (рис. 2.1) разбивают на несколько равных отрезков, называемых интервалами группировки данных, шириной Δ и центрами xk, так что k-й интервал (k = 1, 2, …, K) имеет границы (xk – Δ / 2, xk + Δ / 2). Далее распределяют значения xi по интервалам. Число точек Nk, оказавшихся внутри k-го интервала, даёт число попаданий измеряемой величины в этот интервал. Общее число точек, оказавшихся внутри всех интервалов разбиения, долж­но быть равно полному числу N результатов наблюдений в исходной выборке.

Над каждым интервалом Δk строится прямоугольник высотой fk = Nk / (N Δ). Совокупность таких прямоугольников называется гистограммой (рис. 2.1).

При построении гистограмм интервалы разбиения не следует брать очень большими или очень маленькими. Так, в первом случае прямоугольники на гистограмме будут иметь примерно одинаковую высоту, а во втором – могут появиться интервалы, в которые не попадет ни одного значения случайной величины. Чтобы этого не происходило, придерживаются следующих правил. Число интервалов группировки данных К рассчитывают по формуле К = 1 + 3.2 lg N, где N – объем выборки. Если число К получается дробным, то eго округляют до ближайшего меньшего целого. Ширину интервалов берут равной Δ = (xmaxxmin)/K.



Высоты и площади прямоугольников на гистограмме имеют следующий смысл. Учитывая, что согласно 2.2 относительные частоты Pk = Nk /N приближенно равны вероятности попадания результата каждого отдельного наблюдения в данный интервал, высота каждого прямоугольника на гистограмме fk = Nk /NΔ = Рk /Δ есть вероятность, приходящаяся на единицу длины интервала разбиения или плотность вероятности попадания случайной величины в интервал Δk с центром в точке xk.

Площадь каждого прямоугольника fk Δ = Nk /N = Рk есть вероятность попадания результата в интервал Δk . Сумма площадей прямоугольников, основания которых находятся внутри некоторого интервала [x1, x2], равна вероятности для каждого отдельного наугад взятого результата попасть в этот интервал.

Нетрудно убедиться, что сумма площадей всех прямоугольников равна единице:

. (2.1)

Это означает, что попадание произвольного результата наблюдения в какой-либо из интервалов разбиения в промежутке (xmax, xmin) есть достоверное событие.

Из рис. 2.1 видно, что результаты наблюдений распределены около некоторого значения, абсцисса которого соответствует цен­тру самого высокого прямоугольника на гистограмме. По обе стороны данного прямоугольника расположены прямоугольники убывающих высот и площа­дей. Учитывая, что высоты прямоугольников fk имеют смысл плотности вероятности попадания измеряемой величины в интервал Δk, можно сказать, что гистограмма дает представление о законе распределения измеряемой величины.

Зная координаты центров интервалов разбиения xk и количества попаданий Nk значений измеряемой величины в интервалы, можно найти среднее значение измеряемой величины и величину , характеризующую разброс результатов наблюдений около среднего значения:

(2.2)

(2.3)

где при большом объеме выборки . Величину называют эмпирической дисперсией, а среднеквадратическим отклонением результатов наблюдений от среднего (СКО x). Параметр Sx характеризует ширину распределения значений случайной величины около среднего значения.

Если число наблюдений взять очень большим ( ), т. е. от выборки перейти к генеральной совокупности, а ширины интервалов разбиения очень маленькими, то ломаная огибающая гистограммы перейдет в плавную кривую, называемую функцией плотности распределения вероятности измеряемой величины, которую будем обозначать f(x). В этом случае суммы (2.1)–(2.3) заменятся интегралами, а вероятности Pk – вероятностями попадания случайной величины в интервал ( ). Если случайная величина распределена в интервале (a, b) (заметим, что границы интервала могут быть и бесконечными: ), то выражения (2.1)–(2.3) будут иметь вид

(2.4)

(2.5)

, (2.6)

где есть плотность вероятности распределения случайной величины или просто плотность вероятности; , – генеральные среднее и дисперсия, величина называется стандартным отклонением.

Равенство (2.4) называют условием нормировки функции плотности вероятности. Это условие требует, чтобы площадь под графиком функции вероятности всегда была равна единице.


Дата добавления: 2015-08-05; просмотров: 9; Нарушение авторских прав







lektsii.com - Лекции.Ком - 2014-2021 год. (0.021 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты