КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Выборки. Типы выборок. Расчет ошибки выборки
ТЕМА №5.
Генеральная совокупность Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Выборка (Выборочная совокупность) Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности. Репрезентативность выборки Свойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей. Пример: - Выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы. - Выборка из российских предприятий численностью до 100 человек не репрезентирует все предприятия России. - Выборка из москвичей, совершающих покупки на рынке, не репрезентирует покупательское поведение всех москвичей. В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках соответственно. Важно понимать, что репрезентативность выборки и ошибка выборки – разные явления. Репрезентативность, в отличие от ошибки никак не зависит от размера выборки. Пример: Как бы мы не увеличивали количество опрошенных москвичей-автовладельцев, мы не сможем репрезентировать этой выборкой всех москвичей. Ошибка выборки (доверительный интервал) Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности. Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже. Пример: Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц – 4%, для выборки в 1100 единиц – 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку. Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону. Пример: - Использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома). - Проблема респондентов, отказывающихся отвечать на вопросы анкеты (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%) В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично.
Типы выборок Выборки делятся на два типа: - вероятностные - невероятностные
1. Вероятностные выборки 1.1 Случайная выборка (простой случайный отбор) Такая выборка предполагает однородность генеральной совокупности, одинаковую вероятность доступности всех элементов, наличие полного списка всех элементов.
Простая случайная выборка - это подход, при котором каждый член совокупности имеет одинаковую неизвестную вероятность быть выбранным. Процесс формирования такой выборки прост. напишите имена на теннисных шариках, поместите их в большую чашу, тщательно перемешайте и выберите необходимое число элементов. На практике чаша заменяется таблицами случайных чисел. Простая случайная выборка - наиболее верный способ достижения репрезентативности выборки.
1.2 Механическая (систематическая) выборка Разновидность случайной выборки, упорядоченная по какому-либо признаку (алфавитный порядок, номер телефона, дата рождения и т.д.). Первый элемент отбирается случайно, затем, с шагом ‘n’ отбирается каждый ‘k’-ый элемент. Размер генеральной совокупности, при этом – N=n*k 1.3 Стратифицированная (районированная) Применяется в случае неоднородности генеральной совокупности. Генеральная совокупность разбивается на группы (страты). В каждой страте отбор осуществляется случайным или механическим образом. Для повышения эффективности используется информация о подгруппах, существующих в ее основе. При использовании стратифицированной выборки эффективность повышается благодаря тому, что точность исследования растет быстрее его стоимости.
ПРИМЕР:
Допустим, в ходе маркетингового исследования вам необходимо получить информацию об отношении к курению учащихся школы. Понятно, что мнение младших учеников будет почти однозначным, тогда как в старших классах вариативность ответов может возрасти. В этом случае гораздо разумнее разбить всех учеников, например, на три группы: 1-5 классы, 6-9 кассы, 10-11 классы и сформировать простую случайную выборку в каждой из групп. В младших классах нам потребуется гораздо меньше респондентов, чем в старших. Эти группы выборки называются "стратами", а сама выборка - "стратифицированной".
|