КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Помилки вибірки та методи обчислення середньої та граничної помилки для різних видів вибіркиДля того щоб мати підстави розповсюдити результати вибіркового спостереження на генеральну сукупність, необхідно знати, наскільки добре вибіркова сукупність представляє генеральну. Тобто, чи репрезентативна вибірка. Вибірка, як вже наголошувалося, вважається репрезентативною, якщо узагальнюючі показники вибіркової і генеральної сукупності достатньо близькі. Звичайно складають такі показники вибіркової і генеральної сукупності: – середню величину тієї або іншої ознаки у одиниць сукупності (сер. зарплата, сер. дохід, сер. врожайність); – частку одиниць, що мають ту чи іншу ознаку, тобто питома вага певних одиниць в сукупності (частка осіб з вищою освітою, частка жінок в загальній чисельності працівників і т.д.). Різниця між цими показниками вибіркової і генеральної сукупності і називається помилкою репрезентативності, тобто:
, помилка репрезентативності середньої
, помилка репрезентативності для частки. Вибіркове середнє і частка є змінними величинами, оскільки вони можуть набувати різні значення залежно від того, які одиниці генеральної сукупності потрапили у вибірку. Тобто з однієї і тієї ж генеральної сукупності можна зробити ряд вибірок рівного обсягу. При цьому кожна вибірка матиме свою помилку репрезентативності для середньої і для частки. Тому зі всіх можливих помилок репрезентативності визначається середня помилка вибірки, яка позначається буквою m. Її ще називають стандартна помилка. Перш ніж записати формули, за допомогою яких визначаються середні помилки вибірки, розглянемо, від чого залежить величина цих помилок. Очевидно, що чим більше одиниць відбирається з генеральної сукупності, тим ближче вибіркові показники (середня і частка) наближаються до генеральних. А якщо чисельність вибірки (n) досягне чисельності генеральної сукупності (N), тобто коли вибіркове спостереження перетвориться на суцільне, то взагалі ніяких розбіжностей між вибірковими і генеральними показниками не буде, а помилка вибірки буде дорівнювати нулю. Отже: 1) помилка вибірки залежить від обсягу (чисельності) вибірки – обернено пропорційна чисельності вибірки; 2) помилка вибірки залежить від рівня коливань (варіювання) значень ознаки в генеральній сукупності, прямо пропорційна коливанню значень ознаки в генеральній сукупності; 3) від способу відбору одиниць з генеральної сукупності. Рівень коливань значень ознаки в сукупності визначається, як відомо, показниками варіації. Основними з них є дисперсія і СКВ . З групи теорем Закону великих чисел випливає: – при власно-випадковому відборі, організованому за схемою повторної вибірки, між помилкою вибірки (m), дисперсією і чисельністю вибірки (n) існує така залежність:
. Тобто середня помилка вибірки є СКВ вибіркової середньої від генеральної. Вона дорівнює кореню квадратному з відношення дисперсії ознаки в генеральній сукупності до числа одиниць вибіркової сукупності. Але оскільки практично дисперсія ознаки в генеральній сукупності невідома, то в приведеній формулі використовують дисперсію або СКВ вибіркової сукупності. Це обгрунтовано тим, що при дотриманні принципу випадковості відбору одиниць з генеральної сукупності дисперсія достатньої за об'ємом вибірки прагне відобразити дисперсію в генеральній сукупності. При цьому вона менше генеральної на величину ( ) (якщо n достатньо велике, то це відношення близьке до одиниці). У разі малої вибірки, тобто коли чисельність її менше 30 одиниць, в знаменнику формули замість (n) береться (n-1), тобто
. Якщо вибіркове спостереження застосовується для визначення частки якої-небудь ознаки в сукупності, то середня помилка вибіркової частки обчислюється за формулою
, де – частка одиниць, що мають дану ознаку у вибірці;
– частка одиниць, які не володіють даною ознакою;
– кількість одиниць вибірки; – дисперсія частки ознаки у вибірковій сукупності. При власне-випадковому відборі, організованому за схемою безповторної вибірки, чисельність одиниць генеральної сукупності в процесі відбору скорочується. Тому при безповторному відборі в наведеній формулі вводиться додатковий множник
, де – кількість відібраних одиниць; – кількість одиниць генеральної сукупності; – частка відібраних одиниць з генеральної сукупності; – частка невідібраних (що залишилися) одиниць генеральної сукупності. Тоді середня помилка вибіркового середнього при безповторному відборідорівнює:
, а середня помилка частки
. Оскільки завжди менше , то множник ( ) завжди менше одиниці. Тому величина середньої помилки вибірки при безповторному відборі менше, ніж при повторному, оскільки підкореневе значення формули множитися на число, менше одиниці. При порівняно невеликій частці відібраних одиниць даний множник буде близький до одиниці і ним можна нехтувати. На практиці часто при визначенні середньої помилки вибірки використовують формули без цього множника, хоча вибірка і організована як безповторна. Величина помилки вибірки при цьому дещо збільшується. Наведені формули дають можливість визначити величину середнього відхилення вибіркового середнього від генерального, або вибіркової частки ознаки від генеральної частки. Разом з тим при вирішенні практичних задач однієї тільки середньої помилки вибірки недостатньо. Це пов'язано з тим, що при визначенні помилки конкретної вибірки фактична помилка може бути більше або менше середньої (m). Тому на практиці користуються звичайно не середньою, а граничною помилкою вибірки, тобто межами, за які не вийде фактична помилка вибірки. Вона дозволяє встановити, в яких межах знаходиться величина генеральної середньої. Гранична помилка вибірки , крім усього іншого, залежить ще і від того, з якою ймовірністю вона гарантується. На величину ймовірностей указує коефіцієнт довіри , який визначається на основі теорем П.Л. Чебишева і А.М. Ляпунова та інтеграла Лапласа:
.
Ці теореми визначають ймовірність того, що гранична помилка вибірки не перевищить -кратну (узяту разів) середню помилку вибірки (m). Т.ч., свідчить про ймовірність розбіжності , тобто про ймовірність того, на яку величину генеральна середня відрізнятиметься від вибіркової середньої. Так, з ймовірністю можна гарантувати, що різниця між вибірковою і генеральною середньою не перевищить величини однократної середньої помилки вибірки. З ймовірністю можна гарантувати, що розмір граничної помилки не перевищить двократної середньої помилки (при =2). З ймовірністю – не перевищить 3-кратної середньої помилки (при =3). Т.ч., величину граничної помилки вибірки обчислюють з деякою ймовірністю ( ), якій відповідає -кратне значення (m). Величина ймовірностей для різних значень коефіцієнта ( ) наводиться в спеціально розрахованих таблицях, які наводяться в курсі математичної статистики. Рекомендується запам'ятати такі значення відповідних один одному і .
Т.ч., гранична помилка вибірки залежить від трьох чинників: – обсягу вибірки ; – рівня коливання значень ознаки ; – необхідної гарантованої ймовірностей коефіцієнта довіри . Із введенням коефіцієнта кратності помилки формула граничної помилки має вигляд
. Підставивши в цю формулу замість (m) її аналітичний вираз, одержимо загальні формули граничної помилки. 1 При повторному власне-випадковому відборі: – для середньої величини ознаки ; – для частки . 2 При безповторному власне-випадковому і механічному: – для середнього ; – для частки . 3 При типовому відборі дисперсією ознаки є середня з внутрішньогрупових дисперсій:
, де – вибіркова дисперсія в i-й типовій групі, вона визначається за формулою: ; – число одиниць в i-й типовій групі. Для частки середня з внутрішньогрупових дисперсій визначається
. Тоді гранична помилка вибіркової середньої при типовому повторному відборі буде дорівнювати
; частки .
4 При типовому безповторному відборі для середньої ; для частки . Гранична помилка вибірки при типовому відборі завжди менше помилки при власно-випадковому відборі, оскільки групова дисперсія менше загальної дисперсії. 5 При серійному (гніздовому) відборі кожна з відібраних серій розглядається як одиниця сукупності. Мірою коливання є міжсерійна вибіркова дисперсія ( ), тобто середній квадрат відхилень серійних вибіркових середніх від загальної вибіркової середньої
, де – середня з кожної серії; – загальна вибіркова середня; – число відібраних серій. Гранична помилка середньої при серійному повторному відборі ; помилка частки . 6 При серійному безповторному відборі для середньої ; для частки , де – міжсерійна дисперсія; – число відібраних серій (у вибірковій сукупності); – число серій в генеральній сукупності.
|