КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Основи кореляційно-регресійного аналізу⇐ ПредыдущаяСтр 12 из 12 У кореляційно-регресійному аналізі оцінка лінії регресії здійснюється не в окремих точках, як в аналітичному групуванні, а в кожній точці інтервалу зміни факторної ознаки х .Тобто лінія регресії у даному випадку безперервна і зображується у вигляді певної функції Y=f(х), яка називається рівнянням регресії, а У— це теоретичні значення результативної ознаки. Різні явища по-різному реагують на зміну факторів. Для того, щоб відобразити характерні особливості зв'язку конкретних явищ, статистика використовує різні за функціональним видом регресійні рівняння. Якщо зі зміною фактора х результату змінюється більш-менш рівномірно, такий зв'язок описується лінійною функцією У = а + bх. При нерівномірному співвідношенні варіацій взаємозв'язаних ознак (наприклад, коли прирости значень у зі зміною х прискорені чи сповільнені або напрям зв'язку змінюється), використовують нелінійні регресії, зокрема: степеневу, гіперболу, параболу. Вибір та обгрунтування функціонального виду регресії грунтується на теоретичному аналізі суті зв'язку. Припустимо, що вивчається зв'язок між урожайністю та кількістю опадів. Надто мала і надто велика кількість опадів спричиняють зниження урожайності, максимальний її рівень можливий за умови оптимальної кількості опадів, тобто зі збільшенням факторної ознаки (опади) урожайність спершу зростає, а потім зменшується. Залежність такого роду описується параболою Y= а + bх + сх2. Вивчаючи зв'язок між собівартістю у та обсягом продукції де, використовують рівняння гіперболи У = а + b/х, де а — пропорційні витрати на одиницю продукції, b — постійні витрати на весь випуск. Слід зауважити, що теоретичний аналіз суті зв'язку, хоча й дуже важливий, лише окреслює особливості форми регресії і не може точно визначити її функціональний вид. До того ж у конкретних умовах простору і часу межі варіації взаємопов'язаних ознак х і у значно вужчі за теоретично можливі. І якщо кривизна регресії невелика, то в межах фактичної варіації ознак зв'язок між ними досить точно описується лінійною функцією. Цим значною мірою пояснюється широке використання лінійних рівнянь регресії: У=а + bх Параметр b (коефіцієнт регресії) — величина іменована, має розмірність результативної ознаки і розглядається як ефект впливу х на у. Параметр а — вільний член рівняння регресії, це значення у при х = 0. Якщо межі варіації х не містять нуля, то цей параметр має лише розрахункове значення. Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого — мінімізація суми квадратів відхилень емпіричних значень у від теоретичних У. Математично доведено, що значення параметрів а та b, при яких мінімізується сума квадратів відхилень, визначається із системи нормальних рівнянь. Для вимірювання щільності прямолінійних зв'язків використовується лінійний коефіцієнт кореляції. Найбільш зручною формулою для розрахунку коефіцієнта кореляції за незгрупованими даними є наступна: Коефіцієнт кореляції можна обчислювати і за іншими формулами. Якщо визначена форма кореляційного зв'язку і обчислений коефіцієнт регресії а, то коефіцієнт кореляції можна обчислити за формулою:
Лінійний коефіцієнт кореляції може набувати любих значень в межах від -1 до +1. Якщо г близьке до 1, то зв'язок між ознаками тісний, якщо г наближається до 0, то зв'язок незначний. Знак лінійного коефіцієнта кореляції вказує напрямок зв'язку — знак плюс свідчить про прямий зв'язок, знак мінус — обернений зв'язок. Перевірку істотності зв'язку в кореляційно-регресійному аналізі здійснюють за допомогою тих самих критеріїв і за тими ж процедурами, що і в аналітичному групуванні та дисперсійному аналізі.
|