![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Визначення середньої і граничної похибок та необхідної чисельності вибірки ⇐ ПредыдущаяСтр 6 из 6 Вибіркова сукупність має пізнавальне значення, оскільки дає уявлення (з певною ймовірністю) про показники генеральної сукупності. Але, як уже зазначалось, при вибірковому спостереженні можуть виникати помилки спостереження. У разі несуцільного спостереження, зокрема вибіркового, крім помилок реєстрації можливі так звані помилки вибірки, або репрезентативності (відповідності), які виникають у зв'язку з тим, що відібрана частина сукупності має за досліджуваною ознакою дещо відмінну структуру порівняно з усією сукупністю. Помилки реєстрації, як і при суцільному спостереженні, — це розходження між записаними даними в процесі спостереження і дійсними даними. Виникають вони внаслідок недбалого ставлення, неточності вимірювальних приладів, випадкової описки, різного розуміння тих чи інших положень інструкції чи статистичного формуляра. Помилки репрезентативності — це розходження між середніми величинами або частками ознаки вибіркової і генеральної сукупностей. Помилки репрезентативності можуть бути систематичними і випадковими. Систематичні помилки репрезентативності виникають внаслідок порушення принципів проведення вибіркового спостереження. Вони мають тенденційний характер викривлення величини досліджуваної ознаки в бік її збільшення або зменшення. Випадкові помилки репрезентативності зумовлені тим, що вибіркова сукупність не відтворює точно середні і відносні показники генеральної сукупності. При організації вибіркового обстеження важливо уникнути систематичних помилок. Властиві вибірковому спостереженню випадкові помилки усунути неможливо, проте теорія вибіркового методу дає математичну основу для обчислення розміру і визначення напрямів зменшення їх. Завдання полягає в тому, щоб максимально наблизити показники вибіркової сукупності до показників генеральної сукупності і знайти можливі межі відхилень цих показників, тобто найти помилку вибірки. Обумовимо основні позначення статистичних характеристик, які будуть використовуватись при визначенні помилок вибіркового спостереження (табл. 6.1). Таблиця 6.1. Умовні позначення статистичних характеристик
Ці помилки складаються з помилок репрезентативності і помилок реєстрації. Величини помилок вибірки (репрезентативності) в основному залежить: по-перше, від обсягу вибірки, тому що зі збільшенням числа досліджуваних одиниць результати вибірки все менше будуть відрізнятися від результатів генеральної сукупності; по-друге, від варіації досліджуваної ознаки. Чим більше варіює ознака, тим більше вибіркова середня (частка) відрізняється від генеральної середньої (частки). Оскільки основним показниками варіації ознаки є дисперсія і середнє квадратичне відхилення, то можна стверджувати, що помилка вибірки перебуває у прямій залежності від величин цих показників; по-третє, від способу і виду відбору вибіркової сукупності. Для узагальнюючої характеристики помилок репрезентативності розраховують середню помилку вибірки Таблиця 6.2. Середня помилка вибірки
Особливість обчислення помилок репрезентативності для середньої величини при різних способах відбору полягає в тому, що для її обчислення в основу беруться різні показники дисперсій. При випадковому і механічному відборі для обчислення помилки вибірки використовується загальна дисперсія Коли відбір одиниць здійснюється з окремих типово однорідних груп, виділених за відповідною ознакою, варіації групових середніх немає, і похибка типової вибірки залежить від середньої величини з групових В разі серійної вибірки, яка передбачає суцільне спостереження одиниць у відібраних серіях, похибка вибірки залежить не від числа обстежених одиниць сукупності, від кількості відібраних серій. Похибка вибірки залежатиме не від варіації ознаки у всій сукупності, а від варіації серійних середніх, яка вимірюється міжгруповою дисперсією середньої Похибка вибірки для частки ознаки при серійному відборі залежить від числа серій у генеральній сукупності — R і числа відібраних серій — r. У формулах для обчислення помилок вибірки при безпов-торному відборі у підкореневий вираз формул повторного відбору додається множник
Безповторний відбір гарантує точніші результати, оскільки він виключає можливість обстеження одних і тих самих одиниць при відборі з генеральної сукупності. У статистичному аналізі часто постає потреба порівняння похибки вибірки різних ознак або однієї і тієї ознаки в різних сукупностях. Такі порівняння виконують за допомогою відносної помилки, яка показує на скільки відсотків вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна помилка середньої — це коефіцієнт варіації вибіркових середніх: Для узагальнюючої характеристики помилки вибірки поряд із середньою розраховують і граничну помилку вибірки. Стверджувати, що дана генеральна середня не вийде за межі середньоїпомилки вибірки можна лише з певним ступенем імовірності. У випадку вибіркового спостереження гранична помилка репрезентативності
де Формула граничної помилки вибірки випливає з основних положень теорії вибіркового методу, сформульованих у теоремах ймовірностей, що відображують закон великих чисел. Однією із головних теорем, яку покладено в основу теорії вибіркового методу, є теорема П.Л. Чебишева, за допомогою якої він довів, що з ймовірністю, скільки завгодно близькою до одиниці, можна стверджувати, що при достатньо великому числі незалежних спостережень вибіркова середня буде мало відрізнятися від генеральної середньої при проведенні повторної вибірки. Академік А.А. Марков довів збереження цієї умови для залежних спостережень (без повторної вибірки). Академік А.М. Ляпунов дослідив, що ймовірність відхилень вибіркової середньої від генеральної середньої при достатньо великому обсязі вибірки та обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень при різних значеннях t визначається за формулою: Значення цього інтеграла при різних значеннях tтабульовані і наводяться в спеціальних таблицях. Гранична помилка вибірки розраховується за вибірковим спостереженням по-різному, залежно від видів і способів відбору. Вона дає можливість встановити, в яких межах лежать значення генеральної середньої або частки. За допомогою граничної похибеи вибірки визначають: 1. довірчі межі генеральної середньої і частки з певною ймовірністю; 2. ймовірність того, що відхилення між вибірковими і генеральними характеристиками не перевищує визначену величину; 3. необхідну чисельність вибірки, яка із заданою ймовірністю забезпечує очікувану точність вибіркових показників. Під час вибіркового спостереження важливо правильно визначити необхідну чисельність обсягу вибірки, яка з відповідною ймовірністю забезпечує встановлену точність результатів спостереження. Надмірна чисельність вибірки призводить до затягнення строків дослідження, зайвих витрат часу і коштів, недостатня ж дає результати з великою похибкою репрезентативності. Визначення необхідної чисельності вибірки залежить від алгебраїчного перетворення формул граничної похибки вибірки при різних способах відбору. Формули необхідної чисельності вибірки при повторному і безповторному відборах наведені в таблиці 6.3:
Аналіз наведених в таблиці 6.3 формул дає підстави стверджувати, що чисельність вибірки залежить: 1. від розміру граничної помилки. Чим точніші результати треба одержати, тобто з меншою помилкою вибірки, тим більшою повинна бути чисельність вибірки; 2. від показників варіації ознаки та частки. Чим більші варіації, тим більше треба взяти одиниць для вибіркового спостереження; 3. від ймовірності, з якою вимагається гарантувати результа У статистичній практиці вибіркове спостереження з великих масивів генеральної сукупності часто здійснюють у вигляді комбінованої, ступінчастої або кількафазної вибірки. Вибіркова сукупність у разі комбінованої вибірки формується внаслідок ступінчастого відбору. Загальна помилка для комбінованої вибірки складається з помилок, які можливі на кожному ступені, і визначається як корінь квадратний з квадратів помилок відповідних вибірок. Кінцевою метою будь-якого вибіркового спостереження є поширення його характеристик на генеральну сукупність. На практиці застосовують різні способи поширення вибіркових даних. Спосіб прямого перерахунку використовують у тому випадку, коли метою вибіркового обстеження є визначення обсягу ознаки в генеральній сукупності. Якщо вибіркове спостереження проводять з метою уточнення результатів суцільного спостереження, застосовують спосіб поправочних коефіцієнтів.
|