КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Метод регрессионного анализа
Если объект исследования по техническим, технологическим или экономическим соображениям не допускает преднамеренного варьирования входных переменных в необходимом диапазоне, то для накопления статистического материала применяется пассивный эксперимент, заключающийся в наблюдении и регистрации значений входных\выходных переменных в режиме нормального функционирование исследуемого объекта. Применение метода пассивного эксперимента может быть успешным, если при его проведении соблюдаются необходимые условия, к которым относятся такие, как правильное определение времени регистрации данных, обеспечение независимости соседних измерений и входных переменных друг от друга, достаточный с точки зрения математической статистики объем экспериментальных данных. Выбор структуры модели является наиболее неформализуемой процедурой, так как исследователь до начала эксперимента, как правило, не располагает необходимой априорной информацией. Построение модели существенно упрощается, если в качестве ее составляющих используются полиномы, которые следует включать в уравнение регрессии. Но прежде чем приступить к проведению эксперимента, необходимо выделить наиболее существенные входные факторы из всей совокупности входных величин (модуль №1, занятия № 2-4), оценить степень корреляции между ними и исключить из числа подлежащих регистрации те из них, которые сильно коррелированы с другими. Регрессионный анализ служит для нахождения по результатам эксперимента связи выходного параметра с факторами, которые оказывают влияние на этот параметр. Регрессионный анализ позволяет получить математическую модель процесса на основе оценки коэффициентов регрессии в виде полинома. Классический регрессионный анализ базируется на так называемом "пассивном эксперименте", который сводится к сбору и обработке данных, полученных в результате пассивного наблюдения за производственными процессами. В регрессионном анализе вид связи между параметром Y и факторами Xi , обычно задается в виде разложения в ряд Тейлора: , (9.1) где b0, bi, bij, bii – постоянные коэффициенты уравнения, оценки которых необходимо определить в результате постановки и проведения пассивного эксперимента; n – число наиболее существенных входных величин, полученных в результате отсеивающего эксперимента. Число коэффициентов уравнения (9.1) определяет объем эксперимента. Поэтому выбирают такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованию простоты и адекватности, под которой понимается способность модели предсказывать результаты эксперимента в некоторой области и с требуемой точностью. Так как чаще всего исследователь не располагает достаточной информацией, то на предварительной стадии исследования объекта обычно выбирают полином первой степени, предполагая, что параметры объекта лежат в области, в которой расположен экстремум исследуемой функции, и поэтому объект описывается линейной моделью. Если же эта линейная модель оказывается неадекватной, то в нее включают члены парного взаимодействия XiXj, а при необходимости увеличивают степень полинома до тех пор, пока модель не окажется адекватной. В большинстве практических случаев квадратичная модель оказывается достаточно работоспособной в пределах имеющихся ограничений. В результате регрессионного анализа результатов пассивного эксперимента находятся оценки коэффициентов уравнения регрессии β0, βi, βij, βii, … Пассивный эксперимент с учетом условий накопления статистических данных может применяться для получения математического описания технологических процессов в производстве ЭВC (изготовление печатных плат, оксидирование анодной фольги для электролитических конденсаторов, синтез ферритовых антенн, гальванические покрытия и т. п.), а также для моделирования процессов функционирования радиоэлектронных устройств.
Определение интервала съема данных. Для непрерывныx технологических процессов важно знать, как изменяется теснота корреляционной связи между входными и выходными величинами в зависимости от временного сдвига τ между ними. Для оценки временного сдвига используется взаимно-корреляционна функция Kxy(τ), которая для непрерывных случайных переменных x(t) и y(t) определяется формулой . (9.2) На практике имеют дело обычно с дискретными значениями x(t) и y{t) через равные промежутки времени Dt', причем объем выборки N<∞. В этом случае асимптотически несмещенные оценки взаимно-корреляционных функций вычисляют по формуле , (9.3) где τ=0, 1·Dt', 2·Dt', …, u·Dt'; u – число используемых сдвигов; и= (0,25.—0,35) N; N – объем выборки. По расположению максимума функции Rxy(τ) на оси τ определяют время эквивалентного запаздывания τЭ.З. (рис. 9.1), физический смысл которого состоит в том, что всякий скачок функции x(t) на входе объекта наиболее полно отражается на выходе только через промежуток времени τЭ.З.
Рисунок 9.1 – Взаимно-корреляционная функция Rxy(τ)
Величина интервала съема данных·Dt должна обеспечивать некоррелированность наблюдений, так как согласно предпосылкам регрессионного анализа соседние наблюдения должны быть стохастически независимыми. Для непрерывных технологических процессов, для которых изменения переменных представляют собой некоторый случайный процесс, это равносильно требованию Rxx(τ≥Dt)=0. Асимптотически несмещенная оценка Rxx(τ) (корреляционной функции входной переменной) определяется по формуле , (9.4) По корреляционной функции Rxx(τ) (рис. 9.2) определяют промежутки времени между соседними измерениями x(t), когда последние становятся независимыми. Эти промежутки времени называются временем корреляции τ0.
Рисунок 9.2 – Корреляционная функция Rxx(τ)
Практически интервал ·Dt должен выбираться из условия, что ·Dt≥ τ0 (9.5) и должен быть по возможности ближе к то, но не меньше времени измерения переменных и не превышать значительно время, эквивалентного запаздывания τЭ.З. Приближенное значение τ0 можно оценить по временному графику, случайного процесса, если на нем провести среднюю линию и подсчитать число пересечений кривой изменения переменной N0 за время DT. Тогда время корреляции оценивается по формуле τ0=2(DT)/N0. (9.6) Число пересечений N0 на этом отрезке времени DT должно быть 40–70. Определение времени наблюдения Т. Допустим, задан рабочий диапазон изменения технологической переменной x(t) во времени, причем это изменение представляет собой случайный стационарный; процесс (рис. 9.3): (9.7) Весь диапазон разбит на ряд одинаковых интервалов Dх в соответствии с разрешающей способностью измерительного прибора. Предположим, что известны дискретность проведения опытов Dt и вероятности р1 и р2 попадания случайной величины в нижний и верхний интервалы диапазона .
Рисунок 9.3 – Рабочий диапазон изменения переменной x(t)
Если величина имеет симметричное распределение внутри диапазона, то р1=р2=р. Время наблюдения T=Dtl/p, (9.8) где l — параметр, характеризующий среднее число попаданий перменной в крайний интервал диапазона за время эксперимента; Dt — интервал получения данных; р — вероятность попадания случайной величины в крайний интервал диапазона Dх. Значения параметра l находят из табл. 9.1, задаваясь вероятностью Р, с которой необходимо рассчитать коэффициенты уравнения регрессии; на практике чаще всего выбирается Р = 0,95, т.е. при уровне значимости β = 5%, где β=(1—Р) 100%. Таблица 9.1
Вероятность Р находится по временному графику случайного процесса x(t) (рис. 9.3) по результатам предварительных исследований закона распределения случайной величины .
Определение объема экспериментальных данных. Определи интервал Dt и общее время эксперимента Т, находят число наблюдений (объем выборки) из соотношения N = T/Dt. (9.9)
|