КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Принципы построения статистических группировок.При проведении любой группировки сначала определяется группировочный признак, т.е. по которому расчленяется совокупность на группы. Следующим этапом группировки является определение числа групп. В группировках с атрибутивным признаком в основании число групп зависит от количества типов, а интервал соответствует переходу явления из одного качества в другое (таблица 3.1). В группировках с количественным признаком в основании число групп рекомендуется брать с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц совокупности. Интервалы таких группировок могут быть равными (таблицы 3.3; и 3.4) и неравными (таблицы 3.5; 3.6;). Неравные интервалы, в свою очередь, могут быть возрастающими (таблица 3.5) и убывающими (таблица 3.6). Таблица3.5 Зависимость урожайности зерновых культур от количества внесенных удобрений по фермерским хозяйствам Краснодарского края в 1999 г.
Таблица 3.6 Распределение семейных пар с детьми по возрасту женщины.
В группировках с равным интервалом число групп можно рассчитать математическим путем. С использованием, например, формулы Стерджесса: n=1+3.322lgN, где n - число групп, а N - число единиц совокупности. Согласно этой формуле выбор числа групп зависит от объема совокупности. Недостаток этой формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и если распределение единиц по группировочному признаку близко нормальному. Поэтому есть ряд других формул, но каждая имеет свои недостатки. Если размах вариации группировочного признака (разность между максимальным и минимальным его значениями в совокупности) велик и значения признака изменяются (варьируют) неравномерно, то надо использовать группировку с неравным интервалом. Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна. Возрастающий интервал может возрастать в арифметической прогрессии, а может - в геометрической. Использование неравного интервала более обосновано, но представляет большую трудность. Такую группировку можно составить только на основе знания исходного материала, его анализа и личного опыта специалиста. Главное условие и в этом случае, чтобы не было “пустых” или малочисленных групп. Когда определено число групп, то следует определить интервалы группировки. Величина интервала - это разность между верхними или нижними его границами. Величину равновеликого интервала можно определить по формуле , где xmax - максимальное значение группировочного признака в совокупности, а xmin- минимальное. При образовании интервалов необходимо точно обозначить границы групп. По непрерывно варьирующим признакам образуют непрерывный интервал, т.е. такой, в котором верхняя граница предыдущего интервала равна нижней границе последующего интервала (таблицы 2.3; 2.5; 2.6;). По прерывно варьирующим признакам образуют прерывный интервал, где верхняя граница предыдущего интервала не равна нижней границе последующего интервала (таблица 2.4; по первому признаку). Интервалы группировки могут быть закрытыми и открытыми. Закрытые интервалы имеют обе (верхнюю и нижнюю) границы (таблица 3.4; по основному признаку). Открытые - только одну из них (таблицы 3.3; 3.4 по второму признаку; 3.5; 3.6;). При непрерывном интервале встает вопрос, в какую группу, например в таблице 3.6; включить семьи, где возраст женщин 40 лет? Надо включать по принципу «до». Следовательно, семьи, где возраст женщины 40 лет, попадут в третью группу. Величину интервала в расчетах можно, а порою и нужно, округлять. При этом следует помнить, что по непрерывно варьирующим признакам, если величина интервала получилась целой без округления или округление произведено в меньшую сторону, последнюю группу необходимо делать с открытым интервалом, иначе максимальное значение (по принципу "до") не войдет в группу.
Пример 3.1. Таблица 3.7. Предположим, имеются следующие данные по 30 заводам:
Необходимо произвести группировку заводов по стоимости основных фондов. Для этого надо рассчитать число групп и величину равновеликого интервала. Результаты группировки изложить в табличной форме. Каждую группу и совокупность заводов в целом охарактеризовать: 1) количеством заводов; 2) объемом продукции всего и в среднем на один завод; 3) численностью персонала всего и в среднем на один завод. В основе искомой группировки будет факторный (независимый) признак - стоимость основных фондов (х) в млн. руб. Определяем количество групп: n = 1+ 3,322 lg 30 = 1+ 3,322∙ 1,477=5.9 6 групп. Определим величину равновеликого интервала группировки: i = = (7,9 – 2,0): 6 = 0,98 (1 млн. руб.). Следовательно, в подлежащем макета таблицы будет группировка заводов по стоимости промышленно-производственных основных фондов, в1 млн. руб. Запишем группировку с прерывным интервалом: 2.0-2.9 3.0-3.9 4.0-4.9 5.0-5.9 6.0-6.9 7.0-7. Возможные варианты записи группировки с непрерывным интервалом:
После того как разработано подлежащее таблицы, надо определить сказуемое. Результативным (зависимым) признаком (y) будет объем продукции. Кроме того, надо подсчитать численность единиц совокупности (заводов) по каждой группе и в целом, получится общее число заводов - 30 (контрольная цифра). Кроме этого, в макет таблицы необходимо включить численность персонала. Следовательно, макет таблицы будет иметь следующий вид: Таблица 3.8 Группировка заводов по стоимости основных фондов.
Составляем разработочную таблицу:
I группа 2-3
II группа 3-4
III группа 4-5
IV группа 5-6
V группа 6-7
VI группа 7 и более
На основании итоговых строк разработочной таблицы заполняем макет таблицы. Таблица 3.9 Группировка заводов по стоимости основных фондов.
Как видно из таблицы, с увеличением стоимости основных фондов объем продукции возрастает. Средний объем продукции одного завода составил 4,9 млн. руб. Численность персонала с увеличением стоимости основных фондов также увеличивается и составляет в среднем 435 человек. Группировка, в которой известна только численность групп или удельный вес группы в общем итоге, называется рядом распределения. Ряды распределения, как и всякие другие группировки, могут быть по количественному и атрибутивному признакам. Ряды распределения по атрибутивному признаку называются атрибутивными, а построенные по количественному признаку - вариационными. Вариационные ряды распределения состоят из двух элементов: вариантов и частот. Вариантами называют числовые значения количественного признака. Частотой являются численность каждого варианта (повторяемость). Сумма всех частот является объемом совокупности. Частоты, выраженные в виде относительных величин, называются частостями. Ряд распределения по количественному признаку может быть дискретным и интервальным. В дискретных рядах распределения варианты признака имеют значения целых чисел, т.е. между ними не может быть никаких промежуточных значений. Например, распределение рабочих по тарифному разряду, когда группировочный признак в каждой группе конкретное число: 2 разряд, 3, 4, 5, 6. В интервальных же рядах распределения группировочный признак может принимать любые значения в некотором промежутке (таблицы 2.3;- 2.6;). 3.4. Вторичная группировка. Для достижения сопоставимости данных различных группировок используют вторичную группировку. Вторичная группировка или перегруппировка – это образование новых групп на основе уже сгруппированных данных. Вторичную группировку можно осуществить двумя способами: укрупнения интервала и долевой перегруппировки. Укрупнение интервала заключается в объединении двух, трех и т.д. прежних интервалов. Этот способ чрезвычайно прост, но не всегда приемлем. При долевой перегруппировке за каждой группой закрепляется определенная доля единиц совокупности. Долевая перегруппировка может быть по величине прежнего интервала и по удельному весу групп в общей численности. Долевая перегруппировка по величине прежнего интервала самый распространенный способ перегруппировки. Пример 3.2. Предположим, необходимо сопоставить данные группировок магазинов по товарообороту на 10 кв. м. торговой площади магазина двух областей. Таблица 3.10. Область «А»
Таблица 3.11. Область «Б»
В таком виде они несопоставимы. Так как группировка по области «А» методологически более верная, осуществляем перегруппировку данных по области «А» в группировку области «Б» способом по величине прежнего интервала. Для группировки области «А» новая величина интервала первой группы 50. Чтобы получить интервал 50 из прежних интервалов необходимо суммировать интервалы первой и второй групп, а от третьего интервала взять 1/6 часть (оставшиеся 10 единиц нового интервала /величину интервала третьей прежней группы -60). Остальные 5/6 интервала пойдут во вторую новую группу, где величина интервала также 50 (5/6∙60 =50). Точно в таком же соотношении распределяем по новым группам количество магазинов: Первая группа (812+3037 + 1/6∙10597=5615), вторая группа (5/6∙10597 =8831). В третьей группе новой группировки величина интервала 100. Чтобы получить 100 из прежних интервалов, суммируем интервал четвертой группы 80 и 1/6 интервала пятой группы (20/120) и т. д.
Таблица 3.12. Перегруппировка данных области «А»
Таблица 3.13. Окончательный вид новой группировки по области «А»:
Теперь можно сопоставить данные этих группировок и сделать вывод, что в области «А» наибольший удельный вес 39,2% составляют магазины с величиной товарооборота на 10 кв. м. торговой площади магазина от 100 до 200 тыс. руб., а в области «Б» соответственно 63,9% магазинов имеют от 200 до 400 тыс. руб. на 10 кв. м. торговой площади магазина. Аналогично делают перегруппировку и в тех случаях, когда группировка выполнена с нарушениями принципов группировки и все данные пересчитывают в вновь составленную группировку.
Глава 4. Статистические таблицы и графики.
|