КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Перевірка гіпотези про закон розподілу генеральної сукупностіРозглянуті в попередніх параграфах методи перевірки статистичних гіпотез припускали відомою функціональну форму закону розподілу і стосувались лише числових значень параметрів цього закону. Але є випадки, коли самий вигляд закону розподілу є гіпотетичним і вимагає статистичної перевірки. Зображаючи у графічній формі статистичні ряди та порівнюючи полігони чи гістограми із кривими розподілу відомих законів, можна уявити собі, принаймні з якісного боку, про міру наближення теоретичного та емпіричного розподілів. Користуючись відомими вже методами, можна вимагати перевірки гіпотези про відповідність емпіричного розподілу (зображеного рядом розподілу, полігоном чи гістограмою) деякому гіпотетичному (теоретичному), який описується функцією розподілу F(x). Нульовою гіпотезою тут є твердження про те, що генеральна сукупність підкоряється закону F(x). Для перевірки цієї гіпотези треба підібрати критерій. Критерії перевірки гіпотези про закон розподілу називають критеріями згоди. Вони базуються на виборі певної міри розбіжності між теоретичним і емпіричним розподілами. Якщо така міра (критерій) для випадку, який розглядається, перебільшує певним чином встановлену межу, то гіпотеза відхиляється і навпаки. Розглянемо деякі критерії згоди, які найчастіше використовуються в практичних розрахунках. Критерій c2(Пірсона) Припустимо, що наша гіпотеза цілком визначає вигляд функції розподілу, хоча цей критерій застосовується і для статистичних досліджень. Розіб’ємо область зміни випадкової величини X на скінчену кількість інтервалів D1, D2, ..., Dlі нехай pi– ймовірність для величини X для даного розподілу F(x) прийняти значення, яке належить i-му інтервалові, а mi– кількість значень із вибірки обсягом n (x1, x2, ..., xn), які потрапили на інтервал Di. Очевидно, що мають виконуватись такі умови: (6.73) Якщо гіпотеза, яка перевіряється, є вірною, тоді mi– частота появи події, яка є в кожному із n виконаних випробовувань має ймовірність рі. Отже, ми можемо розглядати miяк випадкову величину, яка має біноміальний закон розподілу з центром в точці npiі зі середнім квадратичним відхиленням
Якщо n®¥ то можна вважати, що частота події miрозподіляється асимптотично нормально з тими ж самими параметрами. При вірності нашої гіпотези асимптотично нормально будуть розподілені (в сукупності) і нормовані величини (6.74) з параметрами (mx= 0; sx= 1), які згідно зі співвідношеннями (3.73) пов‘язані між собою так: (6.75) За міру розбіжності даних вибірки m1, m2, …, mlз теоретичними даними
(6.76) Побудуємо правобічну критичну область, вимагаючи, щоб ймовірність потрапляння критерію в неї (при справедливості нульової гіпотези) дорівнювала вибраному рівневі значущості a
Отже, критичною областю буде
а область прийняття гіпотези Н0є такою:
Таким чином, якщо обчислене за виразом (3.76) значення критерію то немає підстав відхилити гіпотезу Н0, а якщо то нульову гіпотезу відхиляють. Зауваження1. Статистика має c2– розподіл при n®¥. Тому необхідною умовою застосування критерію c2(Пірсона) є великий обсяг вибірки і наявність у кожному інтервалі не менше 5 ¸ 10 спостережень. Якщо їх менше, то потрібно об‘єднати інтервали. Зауваження 2.Через те, що можливі помилки першого та другого роду, а особливо, якщо маленькі різниці між частотами та ймовірностями (добра погодженість теоретичного та емпіричного розподілів), потрібно обережно робити висновки. Перед остаточним висновком слід ще раз перевірити критерійРис. 3.13 Критерій А.Н. Колмогорова є простим, але застосовувати його доречно, коли із деяких теоретичних міркувань є відомою функція розподілу F(x) (її вигляд і параметри). Приклад 12. Елементи вибірки обсягом n = 60 гіпотетично мають нормальний розподіл. Знайдено емпіричну і теоретичну функції розподілу для деякої кількості інтервалів і обчислено величину D = 0,075. Потрібно перевірити за критерієм А.П. Колмогорова нормальність розподілу величини X: {x1, x2, ..., x60}. Розв’язання. Обчислюємо величину . Приймаємо рівень значущості q = 5% та за рівнем значущості і обсягом n = 60, користуючись таблицею (див. Додаток, табл.6) знаходимо значення lq= 0,172. Оскільки lобч.= 0,581 > 0,172, то гіпотеза H0(про нормальний закон розподілу) відхиляється, тобто вибірка не погоджується з гіпотезою. Наближений метод перевірки гіпотези про нормальність Наближена перевірка нормального закону розподілу деякої випадкової величини X за вибірковими даними полягає в порівнянні середніх квадратичних відхилень цих характеристик, які знаходяться за виразами (6.77) зі самими характеристиками асиметрії A*та ексцесу E*, отриманими зі спостережень. Великі в порівнянні із sAта sEзначення A*та E*, отримані зі спостережень, можуть бути підставою для відкидання гіпотези про нормальність досліджуваного розподілу. Приклад 13.Для сукупності кутових нев’язок трикутників (n = 50) ряду триангуляції отримано значення емпіричної асиметрії A*= 0,49 та емпіричного ексцесу E*= – 0,77. Потрібно перевірити гіпотезу про нормальність розподілу кутових нев’язок. Розв’язання. Обчислюємо величини sAта sE
Отримані значення A*= 0,49 та E*= – 0,77 відрізняються від нуля, що може свідчити про порушення нормального розподілу. Але такі розбіжності можна вважати суттєвими, якщо (6.78) Коефіцієнти 3 і 5 у виразах (3.78) отримано за нерівністю Чебишева. Отже, тому гіпотеза про нормальність розподілу кутових нев’язок трикутників ряду триангуляції не суперечить результатам спостережень, і нев’язки можна вважати нормально розподіленими.
|