КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Социально-экономических явленийСоциально-экономические явления представляют собой результат одновременного воздействия большого числа причин. При изучении этих явлений необходимо выявить основные причины, абстрагируясь от второстепенных. Следует обратить внимание на этапы статистического изучения связей: 1 этап – качественный анализ явления, т.е. анализ природы явления методами экономической теории, социологии, конкретной экономики; 2 этап – построение модели связи; 3 этап – интерпретация результатов. Связи между признаками и явлениями, ввиду их большого разнообразия, классифицируются по ряду оснований. Признаки по их значению для изучения взаимосвязи делятся на 2 класса: 1) признаки, обуславливающие изменение других связанных с ними признаков, называются факторными; 2) результативные, изменяющиеся под действием факторных признаков. Связи между явлениями и их признаками классифицируются по степени тесноты, по направлению и по аналитическому выражению. В статистике различают функциональную связь и стохастическую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической. Частым случаем такой связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков. По направлению выделяют связь прямую и обратную. По аналитическому выражению выделяют связи прямолинейные (линейные) и нелинейные (криволинейные). Следует обратить внимание на основные методы выявления наличия связи, ее характера и направления: Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Допустим, имеются данные о двух величинах: Х – 1 2 3 4 5 6 7 8 9 У – 5 6 9 10 14 17 15 20 23 Мы видим, что с увеличением величины Х величина У также возрастает. Можно сделать предположение, что связь между ними прямая и что ее можно описать или уравнением прямой, или уравнением параболы второго порядка. Статистическую связь между двумя признаками можно изобразить графически и по графику судить о наличии, направлении и форме связи. На оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного. Соединив полученные точки нанесенных на график значений Х и У прямыми линиями, получается ломаная, которая называется «ломаная регрессии». Число точек ломаной регрессии должно строго соответствовать числу единиц наблюдения, по которым даны значения обоих признаков. Кривая позволит судить о форме связи, об аналитическом ее выражении. Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями прямой, параболы, гиперболы. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи – гиперболической. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная функция. Модель регрессии может быть построена как по индивидуальным значениям признака, так и по сгруппированным данным. Для выявления связи между признаками по достаточно большому числу наблюдений используется корреляционная таблица. В ней можно отобразить только парную связь, т.е. связь результативного признака с одним фактором, и на ее основе построить уравнение регрессии и определить показатели тесноты связи. Само уравнение регрессии может иметь линейную, параболическую и др. формы. Для составления корреляционной таблицы парной связи статистические данные необходимо предварительно сгруппировать по обоим признакам. (Х и У), затем построить таблицу, по строкам в которой отложить группы результативного, а по столбцам – группы факторного признаков. Корреляционная таблица дает общее представление о направлении связи. Если оба признака (Х и У) располагаются в возрастающем порядке, а частоты (fxy) сосредоточены по диагонали сверху вниз направо, то можно судить о прямой связи между признаками. В противном случае – об обратной. О тесноте связи между признаками Х и У по корреляционной таблице можно судить по кучности расположения частот вокруг диагонали (насколько заполнены клетки таблицы в стороне от нее). Если клетки заполнены большими цифрами, то связь слабая. Чем ближе частоты (fxy) располагаются к одной из диагоналей, тем теснее связь. Если в расположении частот (fxy) нет системности, то можно судить об отсутствии связи. Рассмотрим анализ статистических данных по корреляционной таблице, используя данные примера из темы 9 (таблица 9.8). Вначале сгруппируем единицы наблюдения по значениям факторного и результативного признаков, образовав 4 группы. Величина интервала: . Группы для факторного признака: I - 4 –7 II - 7-10 III – 10-13 IV – 13-16 Группы для результативного признака: I - 8,43-11,38 III – 14,33 – 17,28 II – 11,38 - 14,33 IV – 17,28-20,23
Т а б л и ц а 11.1 – Корреляционная таблица
Анализ таблицы показывает, что частоты (fxy) расположены по диагонали сверху вниз, что свидетельствует о наличии прямой связи между энерговооруженностью труда и выработкой. Наблюдается концентрация частот вокруг главной диагонали и незаполненность оставшихся клеток, поэтому можно предположить достаточно тесную связь между рассматриваемыми признаками. Расчет и анализ средних значений по группам факторных признаков х подтверждает наличие прямолинейной зависимости между х и у. Считая, что зависимость описывается уравнением прямой (ух=ао+а1х) коэффициенты ао, а1 определим из системы нормальных уравнений вида: Отсюда: а0 = - 2,51; а1 = 1,38. Следовательно Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. Построение моделей множественной регрессии следует осуществлять по этапам: 1) выбор формы связи (уравнения регрессии); 2) отбор факторных признаков; 3) обеспечение достаточного объема совокупности для получения несмещенных оценок. Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей: 1) линейная: ; 2) степенная: ; 3) показательная: ; (11.2) 4) параболическая: ; 5) гиперболическая: . Надо иметь в виду, что основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. При построении моделей регрессии можно столкнуться с проблемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Мультиколлинеарность существенно искажает результаты исследования; ее устранение может реализоваться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков. А о наличии мультиколлинеарности можно судить по величине парного коэффициента корреляции ( ). В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а1 (а2) – коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициента регрессии осуществляется с помощью t – критерия Стьюдента: ; (11.3) где ai2 – дисперсия коэффициента регрессии, которая может быть определена по выражению: ; (11.4) где у2 – дисперсия результативного признака; к – число факторных признаков. Параметр модели признается статистически значимым, если tp>tкр (табличное). Проверка адекватности всей модели осуществляется с помощью величины средней ошибки аппроксимации (Е): . (11.5) Значение Е не должно превышать 12-15%. Важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений является измерение тесноты и направления связи. Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции. В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента: ; (11.6) ; (11.7) . (11.8) Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость: ; (11.9) где аi – коэффициент регрессии в уравнении связи; - среднее квадратическое отклонение соответствующего факторного признака. Линейный коэффициент корреляции изменяется в пределах от -1 до 1: -1< <1. Знаки коэффициентов регрессии и корреляции совпадают. При этом интерпретацию выходных значений коэффициента корреляции можно представить в таблице11.2:
Т а б л и ц а 11.2 – Оценка линейного коэффициента корреляции
Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента: . (11.10) Если расчетное значение tp>tкр (табличное), то гипотеза об отсутствии связи отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между х и у . Пример расчета коэффициента корреляции рассмотрен в теме 9 . Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативными и несколькими факторными признаками, а также между каждой парой факторных признаков: ; (11.11) где 2 – дисперсия теоретических значений результативного признака, рассчитанная по уравнению множественной регрессии; 2 – общая дисперсия результативного признака. Проверка значимости коэффициента множественной корреляции осуществляется на основе F – критерия Фишера: . (11.12) Гипотеза о незначительности коэффициента множественной корреляции отвергается, если Fp>Fкр (табличное). R изменяется в пределах от 0 до1 и по определению положителен: 0>R<1. Следует обратить внимание на статистическую оценку социальных явлений, которая осложняется тем, что многие социальные явления не имеют количественной оценки. Количественная оценка связей социальных явлений осуществляется на основе расчета и анализа целого ряда коэффициентов. Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т.е. состоящим из двух качественно отличных друг от друга значений признака.
Т а б л и ц а 11.3 – Таблица для вычисления коэффициентов ассоциации и контингенции
Коэффициенты вычисляются по формулам: Ассоциации: . (11.13) Контингенции: (11.14) При этом Ка >Кк. связь считается подтвержденной, если Ка>0,5 или Кк>0,3. Например, зависимость сокращения рабочих от места работы исследовалась в ходе социологического опроса 200 респондентов, результаты которого представлены в следующей таблице 11.4.
Т а б л и ц а 11.4 – Исходные данные
Коэффициент ассоциации: . Коэффициент контингенции: . Так как Ка<0,5 и Кк <0.3, то сокращение рабочих не зависит от места работы; когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициентов взаимной сопряженности Пирсона и Чупрова,которые вычисляются по формулам: , (11.15) , (11.16) где 2 – показатель взаимной сопряженности; К1 – число значений (групп) первого признака; К2 – число значений (групп) второго признака. Величина 2 определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки минус 1: . (11.17) Чем ближе величины Кп и Кч к 1, тем теснее связь. Рассмотрим вспомогательную таблицу для расчета коэффициента взаимной сопряженности (таблица 11.5).
Т а б л и ц а 11.5 – Вспомогательная таблица для расчета коэффициента взаимной сопряженности
. (11.18) Например, на основе опроса студентов получены следующие данные (таблица 11.6).
Т а б л и ц а 11.6 – Исходные данные
Существует ли взаимосвязь между ответами на поставленный вопрос и курсом, на котором обучаются студенты? Для этого рассчитаем коэффициенты Пирсона и Чупрова. ; . Следовательно, связь между ответами на вопрос и курсом, на котором обучаются студенты, достаточно тесная. Можно предположить, что чем старше студенты, тем более они заинтересованы в увеличении учебной нагрузки по специальным дисциплинам. В статистике существует модификация коэффициента Пирсона (через – критерий): ; (11.19) ; (11.20) В нашем примере:
Другой модификацией коэффициента Чупрова является:
|