КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Решение системы нелинейных уравнений с двумя неизвестными с помощью средства Поиск решения 2 страница, . Из векторов затрат и выпуска образуются матрицы затрат и выпуска А = (a1, a2, …, am), В= (b1, b2, ..., bm). Коэффициенты затрат aij и выпуска bij неотрицательны. Предположим, что для реализации любого процесса необходимы затраты хотя бы одного продукта, т.е. для каждого j найдется хотя бы одно i, такое что aij > 0, (31) и каждый продукт может быть произведён хотя бы одним способом, т.е. для каждого i существует некоторое j, такое что bij>0. (32) Из (31) и (32) следует, что каждый столбец матрицы А и каждая строка матрицы В должны иметь по крайней мере один положительный элемент. Обозначим через xt неотрицательный вектор-столбец интенсивности производственных процессов , а через рt – вектор-строку неотрицательных цен pt = (p1(t), p2(t),…, pm(t)). Вектор уt = Аxt – это вектор затрат при заданном векторе интенсивности процессов xt, а вектор zt = Bxt – вектор выпусков. Модель Неймана описывает замкнутую экономику в том смысле, что для производства продукции в следующем производственном цикле, т.е. в год (t –1): Ахt ≤ Вхt-1, xt > 0, . (32) При этом предполагается, что задан первоначальный вектор запасов Вх0 ≥ 0, Вх0 ≠ 0. Система (32) – это модель Неймана в натуральной форме.
6. Экономические модели и статистические методы
Основы математической статистики Статистические методы являются составной частью эконометрики – науки, изучающей экономические явления с количественной точки зрения. Эконометрика устанавливает и исследует количественные закономерности в экономике на основе методов теории вероятности и математической статистики, адаптированных к обработке экономических данных. Закономерности в экономике выражаются в виде связей и зависимостей экономических показателей, математических моделей их поведения. Такие зависимости и модели могут быть получены только путем обработки реальных статистических данных, с учетом внутренних механизмов связи и случайных факторов. Эконометрический анализ дает возможность обосновать и уточнить форму зависимостей в рассматриваемых макроэкономических моделях, лучше понять механизмы взаимосвязи макроэкономических показателей. Основным элементом экономического исследования является анализ и построение взаимосвязей экономических переменных. Изучение таких взаимосвязей осложнено тем, что они, особенно в макроэкономике, не являются строгими функциональными зависимостями. Во-первых, всегда очень трудно определить все основные факторы, влияющие на данную переменную. Во-вторых, многие такие воздействия носят случайный характер, т.е. содержат случайную составляющую. Любое эконометрическое исследование всегда предполагает объединение теории (экономической модели) и практики (статистических данных). Целью сбора экономических данных является получение информационной базы для принятия решений. Анализ данных и принятие решения проводится на основе какой-либо интуитивной (неявной) или количественной (явной) экономической модели. Использование инструментов Пакета анализа В пакете Excel помимо мастера функций имеется набор более мощных инструментов для работы с несколькими выборками и углубленного анализа данных, называемый Пакет анализа, который может быть использован для решения задач статистической обработки выборочных данных. Для установки раздела Анализ данных в пакете Excel сделайте следующее: - в меню Сервис выберите команду Надстройки; - в появившемся списке установите флажок Пакет анализа. Ввод данных. Исследуемые данные следует представить в виде таблицы, где столбцами являются соответствующие показатели. При создании таблицы Excel формация вводится в отдельные ячейки. Совокупность ячеек, содержащих анализируемые данные, называется входным диапазоном. Необходимо соблюдать последовательность обработки данных. Для использования статистического пакета анализа данных следует: - указать курсором мыши на пункт меню Сервис и щелкнуть левой кнопкой мыши; - в раскрывающемся списке выбрать команду Анализ данных (если команда Анализ данных отсутствует в меню Сервис, то необходимо установить в Excel пакет анализа данных); - выбрать необходимую строку в появившемся списке Инструменты анализа; - ввести входной и выходной диапазоны и выбрать необходимые параметры. Нахождение основных выборочных характеристик. Для определения характеристик выборки используется процедура Описательная статистика. Процедура позволит получить статистический отчет, содержащий информацию о центральной тенденции и изменчивости входных данных. Для выполнения процедуры необходимо: - выполнить команду Сервис→ Анализ данных; - в появившемся списке Инструменты анализа выбрать строку Описательная статистика и нажать кнопку ОК(рис. 35); Рис. 35. Окно выбора метода обработки данных
- в появившемся диалоговом окне указать входной диапазон, то есть ввести ссылку на ячейки, содержащие анализируемые данные. Для этого следует навести указатель мыши на левую верхнюю ячейку данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к правой нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши; - указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой клавишей), далее навести указатель мыши в поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верхнюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши; - в разделе Группировка переключатель установить в положение по столбцам; - установить флажок в поле Итоговая статистика; - нажать кнопку ОК. В результате анализа в указанном выходном диапазоне для каждого столбца данных выводятся следующие статистические характеристики: среднее, стандартная ошибка (среднего), медиана, мода, стандартное отклонение, дисперсия выборки, эксцесс, асимметричность, интервал, минимум, максимум, сумма, счет, наибольшее, наименьшее, уровень надежности.
6.1. Проверка статистических гипотез Помимо описательной статистики важной областью является также аналитическая статистика. Как уже указывалось в разделе «Понятие математической статистики», аналитическая статистика, или теория статистических выводов, ориентирована на обработку данных, полученных в ходе эксперимента, с целью формулировки выводов, имеющих прикладное значение. Здесь решается вопрос, отражают ли наблюдаемые данные объективно существующую реальность. Указанный вопрос решается проверкой соответствующих статистических гипотез. При этом могут выявляться достоверности различий между выборками, взаимосвязи между выборками, влияющие факторы и т.п.
Принятие статистических решений Статистическая гипотеза – это предположение о виде или отдельных параметрах распределения вероятностей, которое подлежит проверке на имеющихся данных. Проверка статистических гипотез – это процесс формирования решения о возможности принять или отвергнуть утверждение (гипотезу), основанный на информации, полученной из анализа выборки. Методы проверки гипотез называются критериями. В большинстве случаев рассматривают так называемую нулевую гипотезу (нуль-гипотезу Н0), состоящую в том, что все события произошли случайно, естественным образом. Альтернативная гипотеза (Н1) состоит в том, что события случайным образом произойти не могли, и имело место воздействие некого фактора. Обычно нулевая гипотеза формулируется таким образом, чтобы на основании эксперимента или наблюдений ее можно было отвергнуть с заранее заданной вероятностью ошибкиα. Эта заранее заданная вероятность ошибки называется уровнем значимости. Уровень значимости – максимальное значение вероятности появления события, при котором событие считается практически невозможным. В статистике наибольшее распространение получил уровень значимости, равный α = 0,05. Поэтому если вероятность, с которой интересующее событие может произойти случайным образом р < 0,05, то принято считать это событие маловероятным, и если оно все же произошло, то это не было случайным. В наиболее ответственных случаях, когда требуется особая уверенность в достоверности полученных результатов, надежности выводов, уровень значимости принимают равным α = 0,01 или даже α = 0,001. Величину Р, равную 1-α, называют доверительной вероятностью (уровнем надежности), то есть вероятностью, признанной достаточной для того, чтобы уверенно судить о принятом статистическом решении. Соответственно, в качестве доверительных вероятностей выбирают значения 0,95, 0,99 и 0,999. Интервал, в котором с заданной доверительной вероятностью Р = 1-α находится оцениваемый параметр, называется доверительным интервалом. В соответствии с доверительными вероятностями на практике используются 95-, 99-, 99,9%-ные доверительные интервалы. Граничные точки доверительного интервала называют доверительными пределами. Выбор того или иного уровня значимости, выше которого результаты отвергаются как статистически не подтвержденные, или, соответственно, доверительной вероятности, в общем случае является произвольным. Окончательное решение зависит от исследователя, традиций и накопленного практического опыта в данной области исследований.
Анализ одной выборки Анализ однородности выборки. Одним из важных вопросов, возникающих при анализе выборки, является вопрос: относится та или иная варианта к данной статистической совокупности? Решение вопроса не представляет сложности, если распределение в этой совокупности является нормальным. Для этого достаточно использовать правило трех сигм. Согласно этому правилу в пределах М ± 3σ находится 99,7% всех вариант. Поэтому если варианта попадает в этот интервал, то она считается принадлежащей к данной совокупности. Если не попадает, то она может быть отброшена. Хотя этот метод и предполагает нормальность исходного распределения, на практике он успешно работает и может быть использован в большинстве других случаев. При числе элементов в выборке п < 30 способ более точного определения границ доверительного интервала рассчитан по формуле , (39) где М – среднее значение; s – стандартное отклонение; tn,p – табличное значение распределения Стьюдента с числом степеней свободы п и доверительной вероятностью р. Построение доверительных интервалов для среднего.Еще одной важной задачей, возникающей при анализе одной выборки, является сравнение выборочного среднего арифметического со средним значением генеральной совокупности. Эта задача решается с помощью статистических критериев. При этом выясняется, значимо ли отличие выборочного среднего значения от среднего значения генеральной совокупности, из которой предположительно взята выборка, или наблюдаемое различие является случайным. Действительно, средние значения, получаемые по выборочным данным, обычно не совпадают с генеральным средним (математическим ожиданием). В связи с этим возникает вопрос: можно ли по результатам выборочной оценки судить о свойствах всей генеральной совокупности? Поскольку каждую оценку, полученную в отдельной выборке, можно рассматривать как случайную величину, то при увеличении числа выборок распределение отдельных оценок будет принимать характер нормального распределения. Это значит, что в случае средних арифметических значения выборочных средних относительно генерального среднего распределяются по нормальному закону, то есть так же как относительные отклонения нормально распределенных вариант от среднего арифметического выборки. Отсюда, в частности, следует, что 68,3% всех выборочных средних находятся в пределах ∆ = М ± т, где ∆ – предельная ошибка выборки, М – среднее выборочное, m – стандартное отклонение среднего значения. Иными словами, имеется вероятность 0,683, что выборочное среднее отличается от генерального не более, чем на ±m. Здесь 0,683 – доверительная вероятность, 1 – 0,683 = 0,317 – уровень значимости α, ∆ = М ± т – 68%-ный доверительный интервал. Для принятой в большинстве исследований доверительной вероятности 0,95 доверительный интервал для средних при достаточно большом числе наблюдений (n > 30) примерно равен ±2т. При доверительной вероятности 0,99, доверительный интервал составит примерно ±3т. Дляболее точного определения границ доверительного интервала можно воспользоваться формулой , (40) где М – среднее значение; s – стандартное отклонение; tn,p – табличное значение распределения Стьюдента с числом степеней свободы п и доверительной вероятностью p; п – количество элементов в выборке. В MS Excel для более точного вычисления границ доверительного интервала и при числе элементов в выборке п < 30 можно воспользоваться функцией ДОВЕРИТ или процедурой Описательная статистика. Функция ДОВЕРИТ (альфа;станд_откл;размер) определяет полуширину доверительного интервала и содержит следующие параметры: - Альфа – уровень значимости, используемый для вычисления доверительной вероятности. Доверительная вероятность равняется 100*(1 – альфа) % процентам, или, другими словами, альфа, равное 0,05, означает 95%-ный уровень доверительной вероятности; - Станд_откл – стандартное отклонение генеральной совокупности для интервала данных, предполагается известным; - Размер – это размер выборки. Пример 1. Найти границы 95%-ного доверительного интервала для среднего значения, если у 25 телефонных аккумуляторов среднее время разряда в режиме ожидания составило 140 часов, а стандартное отклонение — 2,5 часа. Решение: 1. Откройте новую рабочую таблицу. Установите табличный курсор в ячейку А1. 2. Для определения границ доверительного интервала необходимо на панели инструментов Стандартнаянажать кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер функций выберите категорию Статистические и функцию ДОВЕРИТ, после чего нажмите кнопку ОК. Рис. 36. Пример заполнения диалогового окна ДОВЕРИТ
3.В рабочие поля появившегося диалогового окна ДОВЕРИТ с клавиатуры введите условия задачи: Альфа равна 0,05; Станд_откл – 2,5; Размер – 25 (рис. 36). Нажмите кнопку ОК. 4. В ячейке А1 появится полуширина 95%-ного доверительного интервала для среднего значения выборки – 0,979981. Другими словами, с 95%-ным уровнем надежности можно утверждать, что средняя продолжительность разряда аккумулятора составляет 140 ± 0,979981 часа, или от 139,02 до 140,98 часа.
Использование инструмента Пакет анализа для выявления различий между выборками Для анализа двух выборок с помощью t-теста Стьюдента могут быть использованы следующие процедуры: Парный двухвыборочный t-тест для средних; Двухвыборочный t-тест с одинаковыми дисперсиями и Двухвыборочный t-тест с различными дисперсиями. В общем случае необходимо воспользоваться процедурой Двухвыборочный t-тест с различными дисперсиями, так как процедуры Парный двухвыборочный t-тест для средних и Двухвыборочный t-тест с одинаковыми дисперсиями относятся к частным, специальным случаям. Для выполнения процедуры анализа необходимо: - выполнить команду Сервис→ Анализ данных; - в появившемся списке Инструменты анализа выбрать строку Двухвыборочный t-тест с различными дисперсиями, щелкнуть левой кнопкой мыши и нажать кнопку ОК; - в появившемся диалоговом окне указать Интервал переменной 1, то есть ввести ссылку на первый диапазон анализируемых данных, содержащий один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку первого столбца данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши; - указать Интервал переменной 2, то есть ввести ссылку на второй диапазон анализируемых данных, содержащий один столбец данных. Для этого следует навести указатель мыши в поле ввода Интервал переменной 2 и щелкнуть левой кнопкой мыши, затем навести указатель мыши на верхнюю ячейку второго столбца данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши; - указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить флажок в левое поле Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши на правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верхнюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные; - нажать кнопку ОК. Результаты анализа.В выходной диапазон будут выведены: средняя, дисперсия и число наблюдений для каждой переменной, гипотетическая разность средних, df (число степеней свободы), значение t-статистики, Р(Т<= t) одностороннее, t критическое одностороннее, Р(Т<= t) двухстороннее, t критическое двухстороннее. Интерпретация результатов.Если величина вероятности случайного появления анализируемых выборок (P(T<=t) двухстороннее) меньше уровня значимости (α = 0,05), принято считать, что различия между выборками не случайные, то есть различия достоверные. Пример 7.Рассматривается заработная плата основных групп работников агропромышленной компании: обслуживающего персонала и работников низшего звена. Можно ли по этим данным сделать вывод о большей зарплате работников низшего звена?
Решение. Для решения задач такого типа используются так называемые критерии различия, в частности, t-критерий Стьюдента. 1. Введите данные: для персонала – в диапазон А1:А8; работников ресторана – в диапазон В1:В6. 2. Выбор процедуры осуществляется из трех вариантов t-теста. Поскольку данные не имеют попарного соответствия, число их различно, и говорить о равенстве дисперсий затруднительно, выберите процедуру Двухвыборочный t-тест с различными дисперсиями. Для реализации процедуры в пункте меню Сервис выберите строку Анализ данных и далее укажите курсором мыши на строку Двухвыборочный t-тест с различными дисперсиями. 3. В появившемся диалоговом окне задайте Интервал переменной 1. Для этого наведите указатель мыши на верхнюю ячейку столбца (А1), нажмите левую кнопку мыши и, не отпуская ее, протяните указатель мыши к нижней ячейке (А8), затем отпустите левую кнопку мыши. 4. Аналогично укажите Интервал переменной 2, то есть введите ссылку на диапазон второго столбца В1:В6. 5. Далее укажите выходной диапазон. Для этого поставьте переключатель в положение выходной диапазон (наведите указатель мыши и щелкните левой кнопкой), затем наведите указатель мыши на правое поле ввода выходной диапазон и, щелкнув левой кнопкой мыши, указатель мыши наведите на левую верхнюю ячейку выходного диапазона (С1).Щелкните левой кнопкой мыши и нажмите кнопку ОК. Результаты анализа.В выходном диапазоне С1:Е13 появятся результаты процедуры Двухвыборочный t-тест с различными дисперсиями (рис. 37). Рис. 37. Исходные данные (А1:В8) и результаты анализа (С1:Е13)
Интерпретация результатов. Средние значения заработной платы (1962 руб. – для персонала и 2400 руб. – для работников низшего звена) довольно сильно отличаются. Тем не менее нулевая гипотеза о том, что разницы между группами нет (то средние выборок равны между собой), отвергнута быть не может. Это следует из того, что вероятность реализации нулевой гипотезы достаточно велика (р = 0,1389, что больше, чем уровень значимости 0,05, то есть р > 0,05) и величина вероятности случайного появления анализируемых выборок (Р(Т<=t) двухстороннее) больше уровня значимости (α = 0,05). А это позволяет говорить, что различия между выборками могут быть случайными, то есть различия недостоверные. Таким образом, из полученных результатов исследования вытекает, что на основании приведенных данных нельзя сделать вывод о достоверно большей зарплате работников низшего звена. 6.2. Дисперсионный анализ В случае необходимости оценить достоверность различия между несколькими группами наблюдений (выборками) используют методы дисперсионного анализа. Дисперсионный анализ предназначен для исследования задачи о действии на измеряемую случайную величину (отклик) одного или нескольких независимых факторов, имеющих несколько градаций. Причем в однофакторном, двухфакторном и т.д. анализе влияющие на результат факторы считаются известными, и речь идет только о выяснении существенности или оценке этого влияния. Применение дисперсионного анализа возможно, если можно предполагать соответствие выборочных групп генеральным совокупностям с нормальным распределением и независимость распределений наблюдений в группах. В дальнейшем ограничимся рассмотрением простейшего случая дисперсионного анализа – однофакторного анализа. При этом задача заключается в том, чтобы сравнить дисперсию, обусловленную случайными причинами, с дисперсией, вызываемой наличием исследуемого фактора. Если они значимо различаются, то считают, что фактор оказывает статистически значимое влияние на исследуемую переменную. Значимость различий проверяется по критерию Фишера. Влияние случайной составляющей характеризуют внутригрупповая дисперсия, а влияние изучаемого фактора – межгрупповая. Внутригрупповая дисперсия рассчитывается по формуле: (41) межгрупповая: (42) где М – общее среднее: т – количество групп; п – количество элементов в группе. В MS Excel для проведения однофакторного дисперсионного анализа используется процедура Однофакторный дисперсионный анализ. Для проведения дисперсионного анализа необходимо: - ввести данные в таблицу, так чтобы в каждом столбце оказались данные, соответствующие одному значению исследуемого фактора, а столбцы располагались в порядке возрастания (убывания) величины исследуемого фактора; - выполнить команду Сервис → Анализ данных; - в появившемся диалоговом окне Анализ данных в списке Инструменты анализа выбрать процедуру Однофакторный дисперсионный анализ, указав курсором мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку ОК; - в появившемся диалоговом окне задать Входной интервал, то есть ввести ссылку на диапазон анализируемых данных, содержащий все столбцы данных. Для этого следует навести указатель мыши на верхнюю левую ячейку диапазона данных нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши (рис. 38); - в разделе Группировка переключатель установить в положение по столбцам; - указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной интервал (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши на правое поле ввода Выходной интервал и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верхнюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные; - нажать кнопку ОК. Рис. 38. Пример заполнения окна Однофакторный дисперсионный анализ
Результаты анализа. Выходной диапазон будет включать в себя результаты дисперсионного анализа: средние, дисперсии, критерий Фишера и другие показатели. Интерпретация результатов.Влияние исследуемого фактора определяется по величине значимости критерия Фишера, которая находится в таблице Дисперсионный анализ на пересечении строки Между группами и столбца Р-Значение. В случаях, когда Р-Значение < 0,05, критерий Фишера значим и влияние исследуемого фактора можно считать доказанным. Кроме рассмотренной процедуры однофакторного дисперсионного анализа, для проведения двухфакторного дисперсионного анализа в пакете анализа реализованы процедуры Двухфакторный дисперсионный анализ с повторениямии Двухфакторный дисперсионный анализ без повторений. 6.3. Корреляционный анализ Корреляционный анализ служит для выявления взаимосвязей между выборками. Коэффициент корреляции Знание взаимозависимостей отдельных признаков дает возможность решать одну из кардинальных задач любого научного исследования: возможность предвидеть, прогнозировать развитие ситуации при изменении конкретных характеристик объекта исследования. Например, основное содержание любой экономической политики в конечном счете может быть сведено к регулированию экономических переменных, осуществляемому на базе выявленной тем или иным образом информации об их взаимовлиянии. Поэтому проблема изучения взаимосвязей показателей различного рода является одной из важнейших в статистическом анализе.
|