КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Помилки вибірки та методи обчислення середньої та граничної помилки для різних видів вибіркиДля того щоб мати підстави розповсюдити результати вибіркового спостереження на генеральну сукупність, необхідно знати, наскільки добре вибіркова сукупність представляє генеральну. Тобто, чи репрезентативна вибірка. Вибірка, як вже наголошувалося, вважається репрезентативною, якщо узагальнюючі показники вибіркової і генеральної сукупності достатньо близькі. Звичайно складають такі показники вибіркової і генеральної сукупності: – середню величину тієї або іншої ознаки у одиниць сукупності (сер. зарплата, сер. дохід, сер. врожайність); – частку одиниць, що мають ту чи іншу ознаку, тобто питома вага певних одиниць в сукупності (частка осіб з вищою освітою, частка жінок в загальній чисельності працівників і т.д.). Різниця між цими показниками вибіркової і генеральної сукупності і називається помилкою репрезентативності, тобто:
Вибіркове середнє і частка є змінними величинами, оскільки вони можуть набувати різні значення залежно від того, які одиниці генеральної сукупності потрапили у вибірку. Тобто з однієї і тієї ж генеральної сукупності можна зробити ряд вибірок рівного обсягу. При цьому кожна вибірка матиме свою помилку репрезентативності для середньої і для частки. Тому зі всіх можливих помилок репрезентативності визначається середня помилка вибірки, яка позначається буквою m. Її ще називають стандартна помилка. Перш ніж записати формули, за допомогою яких визначаються середні помилки вибірки, розглянемо, від чого залежить величина цих помилок. Очевидно, що чим більше одиниць відбирається з генеральної сукупності, тим ближче вибіркові показники (середня і частка) наближаються до генеральних. А якщо чисельність вибірки (n) досягне чисельності генеральної сукупності (N), тобто коли вибіркове спостереження перетвориться на суцільне, то взагалі ніяких розбіжностей між вибірковими і генеральними показниками не буде, а помилка вибірки буде дорівнювати нулю. Отже: 1) помилка вибірки залежить від обсягу (чисельності) вибірки – обернено пропорційна чисельності вибірки; 2) помилка вибірки залежить від рівня коливань (варіювання) значень ознаки в генеральній сукупності, прямо пропорційна коливанню значень ознаки в генеральній сукупності; 3) від способу відбору одиниць з генеральної сукупності. Рівень коливань значень ознаки в сукупності визначається, як відомо, показниками варіації. Основними з них є дисперсія З групи теорем Закону великих чисел випливає: – при власно-випадковому відборі, організованому за схемою повторної вибірки, між помилкою вибірки (m), дисперсією
Тобто середня помилка вибірки є СКВ вибіркової середньої від генеральної. Вона дорівнює кореню квадратному з відношення дисперсії ознаки в генеральній сукупності до числа одиниць вибіркової сукупності. Але оскільки практично дисперсія ознаки в генеральній сукупності невідома, то в приведеній формулі використовують дисперсію або СКВ вибіркової сукупності. Це обгрунтовано тим, що при дотриманні принципу випадковості відбору одиниць з генеральної сукупності дисперсія достатньої за об'ємом вибірки прагне відобразити дисперсію в генеральній сукупності. При цьому вона менше генеральної на величину У разі малої вибірки, тобто коли чисельність її менше 30 одиниць, в знаменнику формули замість (n) береться (n-1), тобто
Якщо вибіркове спостереження застосовується для визначення частки якої-небудь ознаки в сукупності, то середня помилка вибіркової частки обчислюється за формулою
де
При власне-випадковому відборі, організованому за схемою безповторної вибірки, чисельність одиниць генеральної сукупності в процесі відбору скорочується. Тому при безповторному відборі в наведеній формулі вводиться додатковий множник
де
Тоді середня помилка вибіркового середнього при безповторному відборідорівнює:
а середня помилка частки
Оскільки При порівняно невеликій частці відібраних одиниць даний множник буде близький до одиниці і ним можна нехтувати. На практиці часто при визначенні середньої помилки вибірки використовують формули без цього множника, хоча вибірка і організована як безповторна. Величина помилки вибірки при цьому дещо збільшується. Наведені формули дають можливість визначити величину середнього відхилення вибіркового середнього від генерального, або вибіркової частки ознаки від генеральної частки. Разом з тим при вирішенні практичних задач однієї тільки середньої помилки вибірки недостатньо. Це пов'язано з тим, що при визначенні помилки конкретної вибірки фактична помилка може бути більше або менше середньої (m). Тому на практиці користуються звичайно не середньою, а граничною помилкою вибірки, тобто межами, за які не вийде фактична помилка вибірки. Вона дозволяє встановити, в яких межах знаходиться величина генеральної середньої. Гранична помилка вибірки На величину ймовірностей указує коефіцієнт довіри
Ці теореми визначають ймовірність того, що гранична помилка вибірки Т.ч., Так, з ймовірністю З ймовірністю З ймовірністю Т.ч., величину граничної помилки вибірки обчислюють з деякою ймовірністю ( Величина ймовірностей для різних значень коефіцієнта ( Рекомендується запам'ятати такі значення відповідних один одному
Т.ч., гранична помилка вибірки залежить від трьох чинників: – обсягу вибірки – рівня коливання значень ознаки – необхідної гарантованої ймовірностей коефіцієнта довіри Із введенням коефіцієнта кратності помилки формула граничної помилки має вигляд
Підставивши в цю формулу замість (m) її аналітичний вираз, одержимо загальні формули граничної помилки. 1 При повторному власне-випадковому відборі: – для середньої величини ознаки – для частки 2 При безповторному власне-випадковому і механічному: – для середнього – для частки 3 При типовому відборі дисперсією ознаки є середня з внутрішньогрупових дисперсій:
де
Для частки середня з внутрішньогрупових дисперсій визначається
Тоді гранична помилка вибіркової середньої при типовому повторному відборі буде дорівнювати
частки
4 При типовому безповторному відборі для середньої для частки Гранична помилка вибірки при типовому відборі завжди менше помилки при власно-випадковому відборі, оскільки групова дисперсія менше загальної дисперсії. 5 При серійному (гніздовому) відборі кожна з відібраних серій розглядається як одиниця сукупності. Мірою коливання є міжсерійна вибіркова дисперсія (
де
Гранична помилка середньої при серійному повторному відборі помилка частки 6 При серійному безповторному відборі для середньої для частки де
|