КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Визначення середньої і граничної похибок та необхідної чисельності вибірки ⇐ ПредыдущаяСтр 6 из 6 Вибіркова сукупність має пізнавальне значення, оскільки дає уявлення (з певною ймовірністю) про показники генеральної сукупності. Але, як уже зазначалось, при вибірковому спостереженні можуть виникати помилки спостереження. У разі несуцільного спостереження, зокрема вибіркового, крім помилок реєстрації можливі так звані помилки вибірки, або репрезентативності (відповідності), які виникають у зв'язку з тим, що відібрана частина сукупності має за досліджуваною ознакою дещо відмінну структуру порівняно з усією сукупністю. Помилки реєстрації, як і при суцільному спостереженні, — це розходження між записаними даними в процесі спостереження і дійсними даними. Виникають вони внаслідок недбалого ставлення, неточності вимірювальних приладів, випадкової описки, різного розуміння тих чи інших положень інструкції чи статистичного формуляра. Помилки репрезентативності — це розходження між середніми величинами або частками ознаки вибіркової і генеральної сукупностей. Помилки репрезентативності можуть бути систематичними і випадковими. Систематичні помилки репрезентативності виникають внаслідок порушення принципів проведення вибіркового спостереження. Вони мають тенденційний характер викривлення величини досліджуваної ознаки в бік її збільшення або зменшення. Випадкові помилки репрезентативності зумовлені тим, що вибіркова сукупність не відтворює точно середні і відносні показники генеральної сукупності. При організації вибіркового обстеження важливо уникнути систематичних помилок. Властиві вибірковому спостереженню випадкові помилки усунути неможливо, проте теорія вибіркового методу дає математичну основу для обчислення розміру і визначення напрямів зменшення їх. Завдання полягає в тому, щоб максимально наблизити показники вибіркової сукупності до показників генеральної сукупності і знайти можливі межі відхилень цих показників, тобто найти помилку вибірки. Обумовимо основні позначення статистичних характеристик, які будуть використовуватись при визначенні помилок вибіркового спостереження (табл. 6.1). Таблиця 6.1. Умовні позначення статистичних характеристик
Достовірність вибіркового спостереження забезпечується розрахунками його помилок для середньої величини і для частки (питомої ваги) ознаки, що вивчається. Помилки вибірки (репрезентативності) позначаються символом (дельта) і є різницею між вибірковою середньою (часткою) і генеральною середньою (часткою): - помилка вибірки для середньої величини; помилка вибірки для частки. Ці помилки складаються з помилок репрезентативності і помилок реєстрації. Величини помилок вибірки (репрезентативності) в основному залежить: по-перше, від обсягу вибірки, тому що зі збільшенням числа досліджуваних одиниць результати вибірки все менше будуть відрізнятися від результатів генеральної сукупності; по-друге, від варіації досліджуваної ознаки. Чим більше варіює ознака, тим більше вибіркова середня (частка) відрізняється від генеральної середньої (частки). Оскільки основним показниками варіації ознаки є дисперсія і середнє квадратичне відхилення, то можна стверджувати, що помилка вибірки перебуває у прямій залежності від величин цих показників; по-третє, від способу і виду відбору вибіркової сукупності. Для узагальнюючої характеристики помилок репрезентативності розраховують середню помилку вибірки , її називають ще стандартом. Для визначення середньої помилки репрезентативності вибірки застосовують формули (табл. 6.2): Таблиця 6.2. Середня помилка вибірки
Особливість обчислення помилок репрезентативності для середньої величини при різних способах відбору полягає в тому, що для її обчислення в основу беруться різні показники дисперсій. При випадковому і механічному відборі для обчислення помилки вибірки використовується загальна дисперсія 2 для середньої і w(1-w) — для частки. Коли відбір одиниць здійснюється з окремих типово однорідних груп, виділених за відповідною ознакою, варіації групових середніх немає, і похибка типової вибірки залежить від середньої величини з групових для середньої і - для частки. В разі серійної вибірки, яка передбачає суцільне спостереження одиниць у відібраних серіях, похибка вибірки залежить не від числа обстежених одиниць сукупності, від кількості відібраних серій. Похибка вибірки залежатиме не від варіації ознаки у всій сукупності, а від варіації серійних середніх, яка вимірюється міжгруповою дисперсією середньої . При обчисленні середньої помилки вибірки для частки ознаки в основі розрахунку є міжгрупова (міжсерійна) дисперсія вибіркової частки . Похибка вибірки для частки ознаки при серійному відборі залежить від числа серій у генеральній сукупності — R і числа відібраних серій — r. У формулах для обчислення помилок вибірки при безпов-торному відборі у підкореневий вираз формул повторного відбору додається множник або . Безповторний відбір гарантує точніші результати, оскільки він виключає можливість обстеження одних і тих самих одиниць при відборі з генеральної сукупності. У статистичному аналізі часто постає потреба порівняння похибки вибірки різних ознак або однієї і тієї ознаки в різних сукупностях. Такі порівняння виконують за допомогою відносної помилки, яка показує на скільки відсотків вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна помилка середньої — це коефіцієнт варіації вибіркових середніх: Для узагальнюючої характеристики помилки вибірки поряд із середньою розраховують і граничну помилку вибірки. Стверджувати, що дана генеральна середня не вийде за межі середньоїпомилки вибірки можна лише з певним ступенем імовірності. У випадку вибіркового спостереження гранична помилка репрезентативності може бути більшою, чи дорівнювати, або меншою від середньої помилки репрезентативності . Тому граничну помилку репрезентативності обчислюють з певною ймовірністю Р, якій відповідає t-разове значення . Відповідно до показника кратності помилки і формула граничної помилки репрезентативності має такий вигляд: ; , де — гранична помилка вибірки, — середня помилки вибірки, t — коефіцієнт довіри, який залежить від ймовірності, з якою гарантується значення граничної помилки вибірки. Формула граничної помилки вибірки випливає з основних положень теорії вибіркового методу, сформульованих у теоремах ймовірностей, що відображують закон великих чисел. Однією із головних теорем, яку покладено в основу теорії вибіркового методу, є теорема П.Л. Чебишева, за допомогою якої він довів, що з ймовірністю, скільки завгодно близькою до одиниці, можна стверджувати, що при достатньо великому числі незалежних спостережень вибіркова середня буде мало відрізнятися від генеральної середньої при проведенні повторної вибірки. Академік А.А. Марков довів збереження цієї умови для залежних спостережень (без повторної вибірки). Академік А.М. Ляпунов дослідив, що ймовірність відхилень вибіркової середньої від генеральної середньої при достатньо великому обсязі вибірки та обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень при різних значеннях t визначається за формулою: Значення цього інтеграла при різних значеннях tтабульовані і наводяться в спеціальних таблицях. Гранична помилка вибірки розраховується за вибірковим спостереженням по-різному, залежно від видів і способів відбору. Вона дає можливість встановити, в яких межах лежать значення генеральної середньої або частки. За допомогою граничної похибеи вибірки визначають: 1. довірчі межі генеральної середньої і частки з певною ймовірністю; 2. ймовірність того, що відхилення між вибірковими і генеральними характеристиками не перевищує визначену величину; 3. необхідну чисельність вибірки, яка із заданою ймовірністю забезпечує очікувану точність вибіркових показників. Під час вибіркового спостереження важливо правильно визначити необхідну чисельність обсягу вибірки, яка з відповідною ймовірністю забезпечує встановлену точність результатів спостереження. Надмірна чисельність вибірки призводить до затягнення строків дослідження, зайвих витрат часу і коштів, недостатня ж дає результати з великою похибкою репрезентативності. Визначення необхідної чисельності вибірки залежить від алгебраїчного перетворення формул граничної похибки вибірки при різних способах відбору. Формули необхідної чисельності вибірки при повторному і безповторному відборах наведені в таблиці 6.3:
Аналіз наведених в таблиці 6.3 формул дає підстави стверджувати, що чисельність вибірки залежить: 1. від розміру граничної помилки. Чим точніші результати треба одержати, тобто з меншою помилкою вибірки, тим більшою повинна бути чисельність вибірки; 2. від показників варіації ознаки та частки. Чим більші варіації, тим більше треба взяти одиниць для вибіркового спостереження; 3. від ймовірності, з якою вимагається гарантувати результа У статистичній практиці вибіркове спостереження з великих масивів генеральної сукупності часто здійснюють у вигляді комбінованої, ступінчастої або кількафазної вибірки. Вибіркова сукупність у разі комбінованої вибірки формується внаслідок ступінчастого відбору. Загальна помилка для комбінованої вибірки складається з помилок, які можливі на кожному ступені, і визначається як корінь квадратний з квадратів помилок відповідних вибірок. Кінцевою метою будь-якого вибіркового спостереження є поширення його характеристик на генеральну сукупність. На практиці застосовують різні способи поширення вибіркових даних. Спосіб прямого перерахунку використовують у тому випадку, коли метою вибіркового обстеження є визначення обсягу ознаки в генеральній сукупності. Якщо вибіркове спостереження проводять з метою уточнення результатів суцільного спостереження, застосовують спосіб поправочних коефіцієнтів.
|