КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Обчислення узагальнюючих показників варіації⇐ ПредыдущаяСтр 11 из 11 Таблиця 5.1
Середнє квадратичне відхилення (стандартне відхилення) є мірилом надійності середньої. Чим менше середнє квадратичне відхилення, тим об'єктивніше середня арифметична відображує всю сукупність. Показник середнього лінійного відхилення більш обґрунтований порівняно з розмахом варіації. він не залежить від випадкових коливань крайніх значень, оскільки спирається на всі значення ознаки, враховує всю суму відхилень індивідуальних варіантів від середньої арифметичної та частоти. Однак і цей показник має суттєві недоліки. Основним є те, що в ньому не враховуються знаки (спрямованість) відхилень. Довільне відкидання алгебраїчних знаків призводить до того, що математичні властивості цього показника є далеко не елементарними, а це значно ускладнює використання середнього лінійного відхилення при розв’язуванні задач, пов’язаних з ймовірнісними розрахунками. Тому середнє лінійне відхилення використовують дуже рідко. Намагання скласти показник варіації, який би усунув недоліки розмаху варіації та середнього лінійного відхилення призводить до дисперсії та середнього квадратичного відхилення. Змістовне значення середнього квадратичного відхилення таке ж саме, як і середнього лінійного відхилення. Воно показує, на скільки в середньому відхиляються індивідуальні значення варіант від їх середнього значення. Усі розглянуті показники варіації — розмах варіації, середнє лінійне відхилення, середній квадрат відхилень та середнє квадратичне відхилення — завжди виражають у одиницях вихідних даних ряду та середньої величини. Всі вони є абсолютним виміром варіації. А це означає, що безпосередньо порівнювати абсолютні показники варіації у варіаційних рядах різних явищ не можна. Для того, щоб забезпечити їх порівняння, потрібно обчислити показники, які характеризують варіацію, виражену в стандартних величинах, наприклад, у відсотках. Відношення абсолютних характеристик варіації до середньої величини називаються коефіцієнтами варіації.Коефіцієнти варіації розраховують за формулами: - лінійний - квадратичний - осциляції Коефіцієнти варіації дозволяють порівнювати варіацію різних ознак або варіацію однієї ознаки у різних сукупностях. Для порівняння варіацій найчастіше використовують квадратичний коефіцієнт варіації. Цей показник вживається для оцінки однорідності сукупності, тобто надійності і типовості середньої величини. Розрізняють такі значення відносних коливань: V<10% - незначне коливання V= від 10% до 30% - середнє коливання V>30% - велике коливання Вважають, що сукупність є однорідною, а середня типовою, коли коефіцієнт не перевищує 33%. Лінійний коефіцієнт варіації або відносне лінійне відхилення характерезує частку середнього значення абсолютних відхилень від середньої величини. Квадратичний коефіцієнт варіації свідчить про коливання індивідуальних значень відносно середнього рівня вцілому по сукупності. З вище наведеного можна зробити наступні висновки: 1. Середня величина (середня арифметична) має важливе пізнавальне значення, однак вона не завжди об'єктивно і не завжди із однаковим ступенем достовірності відображує внутрішній стан статистичної сукупності. При однаковому значенні середньої статистичні сукупності можуть бути досить нерівноцінні за рівнем коливань (варіації). 2. Чим менше відхилення, тим типовіша середня, тим більш однорідна сукупність. 3. Універсальним показником варіації є коефіцієнт варіації, цінність якого полягає в тому, що ним можна користуватись для характеристики і порівняння варіації різних сукупностей і різних явищ.
2. Структурні характеристики варіації (мода, медіана…) Крім перелічених вище середніх, у статистичному аналізі, як узагальнюючі характеристики сукупності, використовують такі значення ознаки, які відрізняються особливим розташуванням у варіаційному ряду розподілу. Це так звані структурні (позиційні) середні.Із них найчастіше застосовують моду і медіану. Величина моди і медіани залежить лише від характеру частот, тобто від структури розподілу. Якщо величина середньої арифметичної залежить від усіх значень ознаки, то величина моди і медіани не залежить від крайніх значень ознаки. Це особливо важливо для рядів розподілу, в яких крайні значення ознаки мають нечітко виражені межі (до і понад). Модоюназивають значення ознаки, що має найбільшу частоту в статистичному ряду розподілу. Спосіб обчислення моди залежить від того, в якому вигляді дано значення ознаки: дискретного чи інтервального ряду розподілу. В дискретних варіаційних рядах моду обчислюють без додаткових розрахунків за значенням варіанти з найбільшою частотою. Модальною ціною на той або інший продукт на ринку є та ціна, яка спостерігається найчастіше. В інтервальному варіаційному ряду розподілу модою наближено вважають центральний вараінт так званого модального інтервалу, тобто того інтервалу, який має найбільшу частоту. В межах інтервалу необхідно знайти те значення ознаки, яке є модою. В інтервальних варіаційних рядах розподілу моду визначають за формулою: де х0 - нижня (мінімальна) межа модального інтервалу; h - величина інтервалу; f1 - частота передмодального інтервалу; f2 - частота модального інтервалу;f3 - частота післямодального інтервалу. Формула ґрунтується на припущенні, що відстані від нижньої межі модального інтервалу до моди і від моди до верхньої межі модального інтервалу прямо пропорційні різницям між чисельностями (частотами) модального інтервалу і інтервалів, що прилягають до нього. Медіаноюназивають таке значення ознаки, яке поділяє ранжирований ряд розподілу на дві рівні частини, тобто значення, яке перебуває всередині ряду розподілу. Якщо в дискретному варіаційному ряду 2 т + 1 випадків, то значення ознаки у випадку т + 1 є медіанним. Якщо в ряду парне число 2 т випадків, медіану визначають як середню арифметичну з двох серединних значень. Наприклад, якщо 15 комбайнерів держгоспу розташувати у порядку зростання, тобто в ранжирований ряд за кількістю намолоченого ними зерна, то намолот зерна у восьмого комбайнера буде медіанним. Якщо ж число комбайнерів буде 16 чол., то медіаною буде середнє значення намолоту зерна восьмого і дев'ятого комбайнерів. В інтервальному варіаційному ряду розподілу медіану визначають за формулою: де x0 - нижня (мінімальна) межа медіанного інтервалу; h - величина інтервалу; 0,5 - половина суми частот інтервального ряду розподілу; Sme-1 - сума нагромаджених частот інтервалу, що передує медіанному; fme - частота медіанного інтервалу. Для визначення медіани в інтервальному варіаційному ряду розподілу треба обчислити нагромаджені частоти і відшукати медіанний інтервал. Під нагромадженими частотамирозуміють наростаючий підсумок частот, починаючи з першого інтервалу. Медіанним є той інтервал, на який припадає перша нагромаджена частота, що дорівнює або перевищує половину всього обсягу сукупності. В одномодальних симетричних рядах розподілу середня арифметична, мода і медіана збігаються. Для помірно асиметричних розподілів К. Пірсон встановив таке наближене співвідношення між цими характеристиками: ; або . Моду і медіану застосовують звичайно в тих випадках, коли визначати середню арифметичну недоцільно. Так, немає сенсу обчислювати середній розмір одягу і взуття, що їх виробляють фабрики. Для цього досить знати модальні розміри одягу і взуття, тобто ті, які користуються найбільшим попитом у населення з тим, щоб фабрики, плануючи своє виробництво, могли якомога краще задовольнити попит покупців саме на ці розміри одягу і взуття. Медіана широко використовується при проектуванні місць будівництва об'єктів масового обслуговування населення (шкільних та дошкільних закладів, кінотеатрів, підприємств служби побуту і торгівлі тощо). Наприклад, продовольчий магазин у сільському селищі доцільно розташувати в такій точці, щоб він обслуговував половину кількості мешканців селища, а не розташовувався точно всередині його. Додатково до медіани для характеристики структури варіаційного ряду розподілу обчислюють квартилі, які поділяють ранжирований ряд на 4 рівні частини, і децилі, які поділяють ранжирований ряд на 10 рівних частин. Другий квартиль Q2 дорівнює медіані, а перший – Q1 третій - Q3 обчислюють аналогічно розрахунку медіані, тільки замість медіанного інтервалу беруть для першого квартиля інтервал, в якому знаходиться варіанта, що відокремлює 1/4 кількості частот, а для третього квартиля - інтервал, в якому знаходиться варіанта, що відокремлює 3/4 кількості частот. В інтервальному ряду розподілу перший і третій квартиль розраховують за такими формулами:
де х0 - нижні (мінімальні) межі квартальних інтервалів; h - величина інтервалу; - сума нагромаджених частот ряду розподілу; і - нагромаджені частоти інтервалу, що передує інтервальному відповідно для першого і третього квартилів; і - частоти квартильних інтервалів.
3. Математичні властивості дисперсії та її види Дисперсія (середній квадрат відхилень) має певні математичні властивості, урахування яких дає змогу суттєво спростити її обчислення. 1. Якщо всі значення варіант зменшити на будь-яке стале число А, то середній квадрат відхилень від цього не зміниться. 2. Якщо всі значення варіант поділити на будь-яке стале число і, то дисперсія зменшиться внаслідок цього в і2 разів, а середнє квадратичне відхилення — в і разів. З. Якщо обчислити квадрат відхилень від будь-якої величини А, що тією чи іншою мірою відмінна від середньої арифметичної , то він завжди буде більшим за середній квадрат відхилень (дисперсію) , обчислений від середньої арифметичної , - причому більший на певне значення — квадрат різниці між середньою і цією величиною, тобто на або Дисперсія від середньої величини має властивість мінімальності, тобто вона завжди менша від дисперсії, обчисленої від будь-яких інших величин. У такому випадку, коли величину А прирівняти до нуля, то: або . Отже, дисперсія ознаки, або середній квадрат відхилень дорівнює різниці між середнім квадратом значень ознаки і квадратом середнього значення ознаки. Таким чином, не обчислюючи відхилень можна обчислити дисперсію. На основі наведених математичних властивостей дисперсії базується спрощений спосіб розрахунку дисперсії та середнього квадратичного відхилення, який називається способом моментів, або спосіб відліку від умовного нуля. Він застосовується при умові рівних інтервалів. Використання цього методу є доцільним при великих вихідних значеннях інтервального ряду розподілу. після відповідних перетворень дістанемо:
де - момент першого порядку; - момент другого порядку; А – центр центрального інтервалу; і – ширина інтервалів ( інтервали повинні бути рівні) Отже, дисперсія, обчислена за способом моментів, дорівнює добутку квадрата інтервалу на різницю моменту другого порядку і квадрата моменту першого порядку: . Варіація ознаки формується під впливом різних факторів При вивченні дисперсії досліджуваної ознаки в межах даної сукупності можна визначити три показники коливання ознаки: загальну дисперсію, міжгрупову дисперсію і середню із групових дисперсій. Загальна дисперсія, яку вже було розглянуто, характеризує загальну варіацію ознаки під впливом усіх умов і причин, що зумовили цю варіацію.
Для визначення впливу постійного фактора на розмір варіації потрібно розбити всю сукупність на групи та знайти, як змінюється результат під дією чинника, покладеного в основу групування. Для цього попередньо необхідно обчислити для кожної групи середню величину ознаки, групові (часткові) дисперсії, середню з групових та міжгрупову дисперсію. Групова (внутрішньогрупова) дисперсія дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи від середньої арифметичної відповідної групи. Вона характеризує варіацію ознаки, зумовлену не врахованими при групуванні факторами. Її можна обчислити як середню просту і як зважену за формулами:
або спрощеним способом . Ця дисперсія відображує варіацію ознаки лише за рахунок умов і причин, що діють всередині групи. Середня з групових дисперсій — це середня арифметична зважена з групових дисперсій: . Міжгрупова (факторна) дисперсія дорівнює середньому квадрату відхилень групових середніх від загальної середньої : де -середня кожної окремої групи; - загальна середня всієї сукупності; - частоти відповідних груп. Міжгрупова дисперсія характеризує варіацію результативної ознаки за рахунок групувальної ознаки (під впливом досліджуваного фактора, покладеного в основу групування). Між наведеними видами дисперсій існує певне співвідношення: загальна дисперсія дорівнює сумі середньої з групових та міжгрупової дисперсії. Це співвідношення називають правилом додавання дисперсій, за яким, знаючи два види дисперсій, можна визначити третій. Зіставленням міжгрупової та загальної дисперсій (відповідно до обсягів варіації) можна визначити ступінь впливу факторної ознаки , покладеної в основу групування, на коливання результативної ознаки. при цьому визначають так зване кореляційне відношення: . Воно характеризує частку варіації, зумовлену факторною ознакою. 4. Характеристики форми розподілу Однорідність сукупності — це передумова використання інших статистичних методів (середніх величин, регресійного аналізу тощо). Однорідними вважаються такі сукупності, елементи яких мають спільні властивості (риси) і належать до одного типу, класу. При цьому однорідність означає не повну тотожність рис і властивостей елементів, а лише наявність у них загального в істотному, головному. Формою розподілу статистичної сукупності прийнято називати криву співвідношення частот і значень варіюючої ознаки. Різноманітність статистичних сукупностей — передумова різних форм співвідношення частот і варіюючої ознаки. За своєю формою розподіли поділяють на такі види: одно-, дво- і багатовершинні. Наявність двох і більше вершин свідчить про неоднорідність сукупності, про поєднання в ній груп із різними рівнями ознаки. Розподіли якісно однорідних сукупностей, як правило, одновершинні. Серед одновершинних розподілів є симетричні і асиметричні (скошені), гостро- і плосковершинні. У симетричному розподілі рівновіддалені від центру значення ознаки мають однакові частоти, а в асиметричному — вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщена вліво, то це правостороння асиметрія, і навпаки. Найпростішою мірою асиметрії є відхилення між середньою арифметичною, модою і медіаною. В симетричному розподілі характеристики центру мають однакові значення = Ме = Мо ; в асиметричному між ними існують певні розбіжності. При правосторонній асиметрії > Ме> Мо, при лівосторонній, <Ме <Мо. Асиметрія як відносна статистична характеристика дорівнює різниці між середнім значенням і медіаною або модою, поділеними на середнє квадратичне відхилення. Стандартизовані відхилення або характеризують напрям і міру скошеності розподілу. Очевидно, що в симетричному розподілі А = 0, при правосторонній асиметрії А > 0, при лівосторонній А < 0. У симетричних та помірно асиметричних розподілах вимірюється ексцес розподілу. Асиметрія та ексцес – це дві пов’язані з варіацією властивості форми розподілу. Комплексна їх оцінка виконується на основі центральних моментів розподілу. Алгебраїчно центральний момент розподілу – це середня арифметична k- того ступеня відхилення індивідуальних значень ознаки від середньої: . Очевидно, що момент 2-го порядку є дисперсією, яка характеризує варіацію. Моменти 3-го і 4-го порядку характеризують відповідно асиметрію та ексцес. У симетричному розподілі = 0. Чим більша скошеність ряду, тим більше значення . Для того, щоб характеристика скошеності не залежала від масштабу вимірювання ознаки, для порівняння ступеня асиметрії різних розподілів використовується стандартизований момент При правосторонній асиметрії коефіцієнт Аs > 0, при лівосторонній Аs < 0. Звідси правостороння асиметрія називається додатньою, а лівостороння — від'ємною. Вважається, що при Аs < 0,25 асиметрія низька, якщо Аs не перевищує 0,5 — середня, при Аs > 0,5 — висока. Для вимірювання ексцесу використовується стандартизований момент 4-го порядку Еk = У симетричному, близькому до нормального розподілі Еk = 3. Очевидно, при гостровершинному розподілі Еk > З, при плосковершинному Еk < 3. На відхиленнях часток двох розподілів — за кількістю елементів сукупності і обсягом значень ознаки — грунтується оцінка концентрації. Як міра концентрації використовується півсума модулів відхилень: Число К має назву коефіцієнта концентрації. При рівномірному розподілі К = 0, при повній концентрації К= 1. Звідси випливає, що коефіцієнт концентрації змінюється у межах від 0 до 1. Коефіцієнти концентрації широко використовуються в регіональному аналізі для оцінки рівномірності територіального розподілу виробничих потужностей, фінансових ресурсів тощо.
|