Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Генеральная и выборочная совокупности. Типы выборок




Исходным понятием статистики является понятие совокупность, объединяющее обычно какое-либо множество испытуемых (учащихся) по одному или нескольким интересующим признакам. Главное требование к выделению изучаемой совокупности — это ее качественная однородность, например, по уровню знаний, росту, весу и другим признакам. Члены совокупности могут сравниваться между собой в отношении только того качества, которое становится предметом исследования. При этом обычно абстрагируются от других неинтересующих качеств. Так, если педагога интересует успеваемость учащихся, то он не принимает во внимание, как правило, их рост, вес и другие параметры, не относящиеся непосредственно к изучаемому вопросу.

Применение большинства статистических методов основано на идее использования небольшой случайной совокупности испытуемых из общего числа тех, на которых можно было бы распространить (генерализовать) выводы, полученные в результате изучения совокупности. Эта небольшая совокупность в статистике называется выборочной совокупностью (или короче —выборкой). Главный принцип формирования выборки — это случайный отбор испытуемых из мыслимого множества учащихся, называемого генеральной совокупностью или популяциейобъектов или явлений. Как по анализу элементов, содержащихся в капле крови, медики нередко судят о составе всей крови человека, так и по выборочной совокупности учащихся изучаются явления, характерные для всей генеральной совокупности.

Когда для каждого объекта в выборке измерено значение одной переменной, популяция и выборка называются одномерными. Если же для каждого объекта регистрируются значения двух или нескольких переменных, такие данные называются многомерными.

Одной из основных задач статистического анализа является получение по имеющейся выборке достоверных сведений о интересующих исследователя характеристиках генеральной совокупности. Поэтому важным требованием к выборке является ее репрезентативность, то есть правильная представимость в ней пропорций генеральной совокупности. Достижению репрезентативности может способствовать такая организация эксперимента, при которой элементы выборки извлекаются из генеральной совокупности случайным образом.

Теория выборочного метода основана на законе больших чисел. Закон больших чисел, в его математической трактовке, говорит о том, что с увеличением числа наблюдений уменьшается разница между выборочной средней и генеральной средней, и наоборот, чем меньше выборка, тем меньше надежды на то, что выборочная средняя совпадет по величине со средней арифметической генеральной совокупности. Действие этого закона основано на свойстве самих случайных величин, отрицательные и положительные значения которых способны компенсировать друг
друга тем полнее, чем большему числу испытаний подвергается случайная величина. В связи с этим закономерности
распределения, наблюдаемые в ранжированных совокупностях вариант, следует рассматривать как проявление наиболее общего закона поведения случайных величин — закона больших чисел.

При выборочном наблюдении закон больших чисел и теоремы теории вероятностей в силу случайности отбора единиц позволяют определить ошибки репрезентативности, допущенные при выборочном обследовании. Зная предел допустимой ошибки, на основе закона больших чисел можно определить необходимую численность выборки.
Математическое обоснование закона больших чисел было дано еще в начале XVIII столетия Я. Бернулли. В дальнейшем академики П.Л. Чебышев, А.М. Ляпунов и А.А. Марков расширили и уточнили первоначальную формулировку этого закона.

Необходимый объем выборочного наблюдения зависит от нескольких факторов:

• показателей вариации наблюдаемого признака: чем больше показатели вариации (средний квадрат отклонения), тем больше необходимая численность выборочной совокупности;
• размера предельной ошибки случайной выборки: чем меньше должен быть размер предельной ошибки, тем больше
нужен объем выборочного наблюдения. Иными словами, для получения большей точности необходимо увеличивать объем выборки;
• размера вероятности, с которой требуется гарантировать результаты выборки: чем выше показатель кратности ошибки, тем больше должен быть объем выборки;
• способа отбора единиц выборочного наблюдения из генеральной совокупности. Для бесповторного наблюдения (при прочих равных условиях) требуется меньшая численность выборки, чем при повторном отборе.

Обычно в статистике различают три типа значений переменных: количественные, номинальные и ранговые.

Значения количественных переменных являются числовыми, могут быть упорядочены и для них имеют смысл различные вычисления (например, среднее значение). На обработку количественных переменных ориентировано подавляющее большинство статистических методов.

Значения номинальных переменных (например: пол, вид, цвет) являются нечисловыми, они означают принадлежность к некоторым классам и не могут быть упорядочены или непосредственно использованы в вычислениях. Для анализа номинальных переменных специально предназначены лишь избранные разделы математической статистики, например, категориальный анализ. Однако в ряде случаев для этой цели могут быть использованы и некоторые ранговые и количественные методы, если номинальные значения предварительно заменить на числа, обозначающие их условные коды.

Ранговые или порядковые переменные занимают промежуточное положение: их значения упорядочены (состояние больного, степень предпочтения), но не могут быть с уверенностью измерены и сопоставлены количественно. К анализу ранговых переменных применимы так называемые ранговые методы.

Ранг наблюдения– это тот номер, который получит данное наблюдение в упорядоченной совокупности всех данных – после их упорядочивания по определенному правилу (например, от большего значения к меньшим). Процедура перехода от совокупности наблюдений к последовательности их рангов называется ранжированием.

Ранговые и номинальные значения при вводе данных следует обозначать целыми числами.

 


Поделиться:

Дата добавления: 2015-01-01; просмотров: 208; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.007 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты