КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Середня прогресивна.Год. ТЕМА 5-2 Аналіз рядів розподілу План лекції 1. Поняття про ряд розподілу 2. Оцінка центру розподілу за середньою величиною 3. Види середніх величин. Поняття про середні величини та їх значення в статистиці. Види середніх величин. Середня арифметична проста і зважена. 4. Математичні властивості середньої арифметичної. Обчислення середньої методом моментів. 5. Середня гармонічна та умови її застосування. Середня прогресивна. 7. Структурні середні. 1. Поняття про ряд розподілу
Статистична сукупність формується під впливом причин та умов, з одного боку - типових, спільних для всіх елементів сукупності, а з іншого - випадкових, індивідуальних. Ці чинники взаємозв'язані, а їх спільна взаємодія визначає як індивідуальні значення ознак, так і розподіл останніх у межах сукупності. Характерні властивості структури статистичної сукупності відбиваються в рядах розподілу. Ряд розподілускладається з двох елементів: варіант- значень групувальної ознаки xjта частот (часток) fj. Саме у співвідношенні варіант і частот виявляється закономірність розподілу. Залежно від статистичної природи варіант ряди розподілуподіляються на атрибутивніта варіаційні. Частотними характеристиками будь-якого ряду є абсолютна чисельність j-ї групи - частотаfjта відносна частота j-ї групи - часткаdj. Очевидно, а або 100%. Додатковою характеристикою варіаційних рядів є кумулятивна частота (частка), що являє собою результат послідовного об'єднання груп і підсумовування відповідних їм частот (часток). Кумулятивна частота Sfj (частка Sdj ) характеризує обсяг сукупності зі значеннями варіант, які не перевищують хj (табл. 1). Варіаційний ряд може бути дискретним або інтервальним. Якщо варіаційний ряд інтервальний з нерівними інтервалами, то його частотні характеристики непорівнянні. Тоді, аналізуючи Розподіл, використовують щільністьчастоти (частки) на одиницю інтервалу, тобто , або gо = dj : hj. Таблиця 1 Частотні характеристики рядів розподілу
Як приклад розглянемо розподіл фірм регіону за рівнем фондоозброєності праці в розрахунку на одного працюючого (табл. 2). Згідно зі значеннями кумулятивних часток на більшості фірм (50,6%) фондоозброєність праці не перевищує 5 млн. грн. Щільність розподілу зі зростанням ширини інтервалу зменшується. Таблиця 2 Розподіл фірм за рівнем фондоозброєності праці
Кожний розподіл має характерні особливості. Найтиповіші з них подано в рядах розподілу (табл. 3). Групувальною ознакою є тарифний розряд, значення якого варіюють у межах від 2 до 6. Припустимо, що розподіли робітників умовних професій за рівнем кваліфікації різні. Так, у рядах А і В розподіл частот однаковий, але центри розподілу, навколо яких групуються індивідуальні значення, різні: в ряду А - 5-й розряд, в ряду В - 4-й. У рядах С, D, К центр розподілу такий самий, як і в ряду В, - 4-й, проте форма розподілу різна. Ряди В і С різняться межами варіації; у рядах С і D при однакових межах варіації і симетричному розподілі частот різний ступінь витягнутості вздовж осі ординат, різна крутизна розподілу: у розподілі С лише 36% обсягу сукупності групується навколо центра, у розподілі D - 76% обсягу. Розподіл К відрізняється від інших асиметричністю відносно центра. Таблиця 3 Розподіл робітників за рівнем кваліфікації
Отже, поглиблений аналіз закономірностей розподілу передбачає характеристику зазначених особливостей сукупності, зокрема: а) визначення типового рівня ознаки, який є центром тяжіння; б) вимірювання варіації ознаки, ступеня згрупованості індивідуальних значень ознаки навколо центра розподілу; в) оцінювання особливостей варіації, ступеня її відхилення від симетрії; г) оцінювання нерівномірності розподілу значень ознаки між окремими елементами сукупності, тобто ступінь їх концентрації. Базою аналізу закономірностей розподілу є варіаційний ряд - дискретний або інтервальний - з рівними інтервалами.
2. Оцінка центру розподілу за середньою величиною
Центром тяжіння будь-якої статистичної сукупності є типовий рівень ознаки, узагальнююча характеристика всього розмаїття її індивідуальних значень. Такою характеристикою є середня величина х . За даними ряду розподілу середня обчислюється як арифметична зважена; вагами є частоти fj або частки df. В інтервальних рядах, припускаючи рівномірний розподіл елементів сукупності в межах j-го інтервалу, як варіанту хj- використовують середину інтервалу. При цьому ширину відкритого інтервалу умовно вважають такою самою, як сусіднього закритого інтервалу. Дані для розрахунку середнього рівня в інтервальному ряду розподілу наведено в табл. 4. Згідно з розрахунками, у середньому на одного члена домогосподарства припадає х - 1800 : 200 = = 9м2 житлової площі. Це типовий рівень забезпеченості населення житлом. Таблиця 4 Розподіл домогосподарств міста за рівнем забезпеченості житлом
Окрім типового рівня важливе значення має домінанта, тобто найбільш поширене значення ознаки. Таке значення називають модою (Мо). У дискретному ряду моду визначають безпосередньо за найбільшою частотою (часткою). Наприклад, якщо депозитна ставка у восьми комерційних банків - 12% річних, а в двох - 10%, то модальною є ставка 12%. В інтервальному ряду за тим самим принципом визначається модальний інтервал, а в разі потреби конкретне модальне значення в середині інтервалу обчислюється за інтерполяційною формулою де х0 та h - відповідно нижня межа та ширина модального інтервалу, fmо, fmo-1, fmo+1 - частоти (частки) відповідно модального, передмодального та післямодального інтервалів. Для моди як домінанти число відхилень (х - Мо) мінімальне. Оскільки мода не залежить від крайніх значень ознаки, то її доцільно використовувати тоді, коли ряд розподілу має невизначені межі. Характеристикою центра розподілу вважається також медіана(Me) - значення ознаки, яке припадає на середину впорядкованого ряду, поділяє його навпіл - на дві рівні за обсягом частини. Визначаючи медіану, використовують кумулятивні частоти Sf, або частки Sdl.. У дискретному ряду медіаною буде значення ознаки, кумулятивна частота якого перевищує половину обсягу сукупності, тобто Sf. ≥0,5∑fj (для кумулятивної частки Sdj ≥0,5). В інтервальному ряду за цим принципом визначають медіанний інтервал, а значення медіани в середині інтервалу, як і значення моди, обчислюють за інтерполяційною формулою:
де х0 та h - відповідно нижня межа та ширина медіанного інтервалу; fme - частота медіанного інтервалу; Sfme-1 - кумулятивна частота передмедіанного інтервалу. У симетричному розподілі всі три зазначені характеристики центра розподілу однакові: Mo = Me = , у помірно асиметричному відстань медіани до середньої втричі менша за відстань середньої до моди, тобто 3( -Ме) ≈ -Мо. Медіана, як і мода, не залежить від крайніх значень ознаки; сума модулів відхилень варіант від медіани мінімальна, тобто вона має властивість лінійного мінімуму: Цю властивість медіани можна використати при проектуванні розміщення зупинок міського транспорту, заготівельних пунктів тощо. Окрім моди і медіани, в аналізі закономірностей розподілу використовуються також квартилі та децилі. Квартилі- це варіанти, які поділяють обсяги сукупності на чотири рівні частини, децилі- на десять рівних частин. Ці характеристики визначаються на основі кумулятивних частот (часток) за аналогією з медіаною, яка є другим квартилем або п'ятим децилем.
3. Види середніх величин. Поняття про середні величини та їх значення в статистиці
Серед узагальнюючих показників, якими статистика характеризує суспільні явища та властиві їм закономірності, важлива роль належить середнім величинам. Досліджувані статистикою суспільні явища, як правило, мають масовий характер, а розміри тієї чи іншої ознаки окремих одиниць статистичної сукупності - різне кількісне значення, тобто їм властива мінливість. Мінливість ознак статистичної сукупності залежить від конкретних умов і чинників, які впливають на ту чи іншу ознаку. Варіація ознак і є тією причиною, яка зумовлює необхідність вдаватися до розрахунку середніх величин. Метод середніх величин - це один із найпоширеніших статистичних прийомів узагальнення. Важливість середніх величин для статистичної практики і науки відзначалась у працях багатьох вчених. Зокрема, англійський економіст В. Петті (1623-1667) при вивченні економічних проблем широко використовував середні величини. Він вважав сталість середньої величини як відображення закономірності досліджуваних явищ. Теоретичні розробки бельгійського статистика А. Кегле (1796-1874) внесли значний вклад у розробку теорії сталості статистичних показників. Згідно з Кегле, постійні причини діють однаково на кожне досліджуване явище. І саме вони роблять ці явища схожими один на одного, створюють загальні для всіх них закономірності. Наслідком вчення А.Кетле про загальні та індивідуальні причини стало виділення середніх величин в якості основного методу статистичного аналізу. Він підкреслював, що статистичні середні являють собою не просто метод математичного вимірювання, а й категорію об'єктивної дійсності. Англійський статистик А.Боулі (1869-1957), який є відомим теоретиком нового часу у галузі теорії середніх величин, визначив значення середніх або, за його виразом, "їх функцію". Він писав, що функція середніх зрозуміла: вона полягає в тому, щоб виразити складну групу за допомогою небагатьох простих чисел. Розум не в стані охопити сотні тисяч статистичних даних, вони повинні бути згруповані, спрощені, приведені до середніх. У наступні роки середня величина все частіше розглядається як соціальне значуща характеристика, інформативність якої залежить від однорідності даних. Правильне розуміння суті середньої величини визначає її особливу значимість в умовах ринкової економіки, коли середня величина через одиничне і випадкове дозволяє виявити загальне і необхідне, виявити тенденцію закономірностей економічного розвитку. Середня величина - це узагальнююча характеристика сукупності однотипних одиниць за певною кількісною ознакою. Вона характеризує типовий рівень варіюючої ознаки і відображає те спільне, характерне, що об'єднує всю масу елементів, тобто статистичну сукупність. За допомогою середньої величини відбувається згладжування відмінностей величини ознаки, які виникають з тих чи інших причин в окремих одиниць спостереження. Наприклад, середній виробіток робітника залежить від багатьох факторів: кваліфікації, стажу роботи, віку, організації виробничого процесу тощо. Середній виробіток відображує загальну властивість всієї сукупності. Середня величина — величина абстрактна, тому що характеризує значення ознаки абстрактної одиниці і може не збігатися з жодним з індивідуальних значень ознаки. Абстрагуючись від індивідуальних особливостей окремих елементів, можна виявити те загальне, типове, що притаманне всій сукупності в конкретних умовах місця і часу. Проте слід пам'ятати, що середня відображає типовий рівень ознаки лише в тому випадку, коли статистична сукупність, за якою вона обчислюється, якісно однорідна. Це одна з основних умов наукового застосування середніх у статистиці. Саме тому застосування методу середніх в статистиці пов'язують з методом групування. Крім того, типовий рівень ознаки, що вивчається, проявляє себе лише у випадку узагальнення масових фактів. В разі узагальнення масових фактів випадкові відхилення індивідуальних величин від загальної тенденції взаємно погашаються в середній величині. Ця вимога стосовно обчислення середніх величин пов'язує метод середніх із законом великих чисел. Обчислення середніх величин є складовою частиною багатьох статистичних методів: групувань, рядів динаміки, індексних розрахунків, показників варіації, вибіркового методу та ін. За допомогою середніх величин проводять порівняльний аналіз у часі і просторі, вивчають тенденції та закономірності розвитку явищ, їх інтенсивність та характер коливань, досліджують зв'язки і залежності між явищами. Критерієм розрахунку середньої величини є правильний вибір початкової бази обчислень, яка відображає зміст середньої величини та її зв'язок з іншими показниками. Розрахунок середніх величин повинен бути підпорядкований соціально-економічному змісту явищ, реально відображати істотну характеристику суспільного явища. Виходячи з того, що середня величина характеризує розмір ознаки в розрахунку на одну одиницю, існує взаємозв'язок між середньою величиною і показниками, які потрібні для її визначення. Приклади логічних формул деяких середніх:
Побудова таких співвідношень є базою для розрахунку середніх величин. Чисельник логічної формули являє собою обсяг значень варіюючою ознаки (визначальну властивість), а знаменник - обсяг сукупності. Як правило, визначальна властивість - це реальна абсолютна або відносна величина, яка має самостійне значення в аналізі. Крім того, спосіб розрахунку залежить від характеру вихідної інформації. У кожному конкретному випадку для реалізації логічної формули використовується певний вид середньої. Види середніх величин В практиці статистичної обробки інформації в залежності від особливостей досліджуваних явищ застосовуються різні види середніх величин. Середні величини в статистиці належать до класу степеневих середніх, які описує формула: де x — рівень ознаки, варіанти; n - число варіантів; т — показник степеня середньої. Зміна степеня середньої величини визначає її вигляд: при т = 1 — середня арифметична; при т = 0 — середня геометрична; при m = -1 — середня гармонічна; при т = 2 — середня квадратична; при т = 3 — середня кубічна. Із степеневих середніх у статистиці найчастіше використовують середню арифметичну, рідше — середню гармонічну, середню геометричну - тільки для обчислення середніх темпів динаміки, а середню квадратичну - для розрахунків показників варіації. Середню кубічну для статистичних розрахунків майже не використовують. Залежно від характеру вихідної інформації середня будь-якого виду може бути простою чи зваженою. Середня величина позначається (риска над символом означає осереднення індивідуальних значень) і має таку саму одиницю вимірювання, як і індивідуальна ознака. Питання про те, який вид середньої слід використати в кожному окремому випадку, вирішується шляхом конкретного аналізу досліджуваної сукупності і визначається матеріальним змістом досліджуваного явища. РОЗРАХУНОК СЕРЕДНІХ ВЕЛИЧИН
де, - значення ознаки; f – частота (вага); n – сукупності (n = ) w – вага (w=x*f). Середня арифметична проста і зважена Одним із найпоширеніших видів середніх величин є середня арифметична, її застосовують в тих випадках, коли обсяг варіаційної ознаки для всієї сукупності формується як сума значень ознаки окремих одиниць досліджуваної сукупності. Середня арифметична може бути простою і зваженою. Розглянемо розрахунок середньої арифметичної простоїна наступному прикладі: Припустимо, що треба обчислити середній рівень кваліфікації бригади із 10 робітників, тарифний розряд яких складає: 6, 3, 4, 3, 5, 2, 4, 5, 4, 4. Названі числа — це індивідуальні значення ознаки або варіанти. Для обчислення середнього тарифного розряду треба суму всіх значень ознаки (суму розрядів), тобто обсяг ознаки, розділити на кількість одиниць сукупності (кількість робітників в бригаді):
Позначивши варіанти x1, x2 ... xn, цей розрахунок можна записати так: Наведена формула має назву середньої арифметичної простої і застосовується тоді, коли розрахунок здійснюють на основі первинних, не згрупованих даних. В практиці аналітичної роботи нерідко виникає потреба розрахувати середні величини на основі згрупованих даних, передусім даних варіаційного ряду розподілу. Наприклад, наведені у попередньому прикладі дані про тарифні розряди робітників бригади, можна об'єднати в групи і записати у вигляді варіаційного ряду розподілу: Ряд розподілу робітників за тарифними розрядами Тарифний розряд робітників 2 3 4 5 6 Кількість робітників 1 2 4 2 1 У наведеному ряді розподілу варіанти - це розряди. Кожна з варіант має відповідну частоту, тобто кількість робітників. При обчисленні середньої за даними варіаційного ряду розподілу для визначення загального обсягу ознаки слід кожну з варіант помножити на частоту і отримані результати додати. Таке множення варіантів на їхні частоти в статистиці називають зважуванням, а обчислена в такий спосіб середня - середньою арифметичною зваженою. Обчислення середньої арифметичної зваженої в наведеному прикладі матиме такий вигляд:
Якщо частоту (вагу) позначити f, то формула середньої арифметичної зваженої матиме такий вигляд: Таким чином, для обчислення середньої арифметичної зваженої виконуються такі послідовні операції: знаходження добутків варіантів та їх частот, додавання одержаних добутків, ділення суми добутків на суму частот. Частоти варіантів можуть бути не тільки абсолютними величинами, а й відносними у вигляді часток або відсотків. Середня арифметична зважена застосовується у тих випадках, коли варіанти мають різні частоти. Використання незваженої середньої у таких випадках неприпустимо, тому що це неминуче призводить до викривлення статистичних показників. Середні величини обчислюють за даними не тільки дискретних, а й інтервальних рядів розподілу, коли варіанти ознаки подають у вигляді інтервалу (від ... до). В таких випадках для обчислення середньої величини спочатку потрібно перетворити інтервальний ряд на дискретний, для чого треба визначити середнє значення інтервалу кожної групи (центр інтервалу). Середнє значення інтервалу дорівнює півсумі його верхньої та нижньої меж: Якщо в рядах розподілу є відкриті інтервали, то в таких рядах величина інтервалу першої групи умовно дорівнює величині інтервалу наступної групи, а величина інтервалу останньої групи - величині інтервалу попередньої групи. 4. Математичні властивості середньої арифметичної Обчислення середньої арифметичної способом моментів Середня арифметична має певні математичні властивості, використання яких дає можливість значно спростити її обчислення. Розглянемо найважливіші з цих властивостей. 1. Добуток середньої на суму частот завжди дорівнює сумі добутку варіантів на частоти, тобто 2. Якщо від кожної варіанти відняти або додати будь-яке довільне число, то добута середня зменшиться або збільшиться на таке саме число, тобто: 3. Якщо всі варіанти збільшити (зменшити) в і разів, то середня арифметична збільшується (зменшується в стільки ж разів, тобто 4. Алгебраїчна сума відхилень окремих варіант ознаки від середньої дорівнює нулю. 5. Сума квадратів відхилень окремих варіант ознаки від середньої менша, ніж від будь-якої іншої величини. 6. Якщо всі частоти поділити чи помножити на будь-яке число, то середня арифметична від цього не зміниться. Викладені вище властивості середньої арифметичної дають можливість в багатьох випадках суттєво спростити її обчислення і, особливо, при розрахунках з великими числами або при великій їх кількості. На підставі другої та третьої властивостей можна: • відняти від кожної варіанти стале число, найкраще вибрати варіанту з найбільшою частотою; • поділити всі варіанти на стале число, переважно за таке беруть інтервал. Обчислення середньої арифметичної за вказаним способом дістало в статистиці назву способу відліку від умовного нуля, або способу моментів. Обчислення середньої способом моментів використовують у рядах з рівними інтервалами і розрахункова формула має такий вигляд: = m1i + А, де момент першого порядку обчислюють за формулою:
5. Середня гармонічна таумови її застосування Характер первинних статистичних даних у деяких випадках виключає застосування середньої арифметичної. Поряд із середньою арифметичною в статистичних дослідженнях використовують інші види, зокрема, середню гармонічну. За своїми властивостями середню гармонічну можна застосовувати тоді, коли загальний обсяг ознаки формується як сума зворотних значень варіантів. Середня гармонічна - це величина, обернена середній арифметичній з обернених значень ознаки. За змістом середня гармонічна - це перетворена середня арифметична зважена, її використовують тоді, коли показники частоти (f),які виступають статистичною вагою, відсутні, але відомі добутки ознаки (х)на ваги (f),тобто показник w> (w = xf). Отже, якщо крім значень ознаки відомі значення знаменника логічної формули (частоти), то середню розраховують за формулою арифметичної. А коли знаменник невідомий, використовується формула середньої гармонічної. Це правило, хоча й формальне за характером, забезпечує обґрунтований вибір, який узгоджується з логічною формулою.
|