Лекція 4-5. Початкова обробка даних

⇐ ПредыдущаяСтр 60 из 123Следующая ⇒

При дослідженні в різних галузях науки, техніки чи виробництва ми отримуємо набір даних, які необхідно зберігати та використовувати. Дослідники отримують в найпростішому випадку задану функцію у вигляді таблиці. Наприклад, отримані такі результати 12 вимірів з постійним інтервалом зміни аргументу.

X	Y=F(X)
x₁		y₁	0.142
x₂		y₂	0.148
x₃		y₃	0.155
x₄		y₄	0.152
x₅		y₅	0.141
x₆		y₆	0.136
x₇		y₇	0.128
x₈		y₈	0.138
x₉		y₉	0.140
x₁₀		y₁₀	0.124
x₁₁		y₁₁	0.112
x₁₂		y₁₂	0.067

Часто при цьому виникають такі задачі:

1. Знайти значення функції Y для будь-якого значення X

2. Економно відобразити отриманий набір даних.

Перша проблема вирішується методами апроксимації та інтерполяції, а друга – методами апроксимації.

Розглянемо методи апроксимації функції, яка задана таблично.

Апроксимація – це пошук аналітичного виразу (формули ), яка відображає отриманий набір даних. Найчастіше ми шукаємо параметри найпростішої функціональної залежності, тобто лінійної функції:

Y=F(X) = ax + b ( 1 )

Якщо ми отримаємо параметри лінійної функції ( a, b), то можемо знайти значення функції Y для будь-якого значення аргументу. До того ж зберігати потрібно тільки два параметри, а не всю таблицю.

Найпростіший метод пошуку параметрів – це метод двох точок. Суть методу полягає в проведені прямої між двома точками. Як правило, ми використовуємо першу і останню точки. Але в тих випадках, коли ці точки значно відрізняються від основних даних, то можна взяти інші точки.

Для визначення параметрів ( a, b) запишемо значення функції в крайніх точках

y₁ = a x₁ + b

y_n = a x_n + b

Тут n позначає індекс останнього елементу набору даних.

З цих двох рівнянь легко визначити невідомі параметри:

a = ( y_n - y₁ )/ (x_n - x₁ )	( 2 )
b = y₁ - a x₁

Цей метод покажемо на малюнку 1. Червоною лінією ми відображаємо наші табличні дані.

Мал.1

З малюнку видно, що тільки крайні точки збігаються з лінією, а всі останні точки розташовані поза лінією, тобто існує похибка, яку можна записати так:

e_i = y_i - a x_i –b ( 3 )

Недоліком цього методу полягає в тому, що крім двох точок всі останні не використовуються для визначення параметрів апроксимуючої функції.

Більш точно відображає набір даних пряма визначена методом нульової похибки.

Суть методу полягає в створенні двох рівнянь з невідомими параметрами апроксимуючої функції. Для цього знайдемо суму похибок першої та другої половини даних і прирівняємо їх 0.

n div 2 n

S e_i = 0 S e_i = 0 4 )

i = 1 i = n div 2 +1

Маємо два рівняння і дві невідомі – параметри лінії - ( a, b)

n div 2 n

S (y_i - a x_i –b) = 0 S (y_i - a x_i –b) = 0 ( 5 )

i = 1 n div 2 +1

З цих рівнянь легко визначити параметри прямої лінії.

n div 2 n n div 2 n

a = ( S y_i - S y_i ) /( Sx_i – S x_i) ( 6 )

i = 1 i = n div 2 +1 i = 1 n div 2 +1

або

a = (S1 – S2)/(S3-S4) ( 7 )

де

n div 2 S1 = S y_i i =1 n div 2 S3 = S x_i i =1

n S2 = S y_i i = n div 2 +1 n S4 = S x_i i = n div 2 +1

Визначивши a легко знайти і параметр b

b = (S1- aS2)/n ( 8 )

Цей метод значно кращий за попередній, бо враховує значення всіх точок. До того ж сума похибок як для першої половини даних, так і для другої дорівнює нулю. Але ці похибки мають різні знаки і можуть сягати великих значень. Щоб уникнути великих відхилень, розглянемо суму квадратів похибок:

G(a,b) =S (e_i)² =S (y_i - a x_i –b)² (i= 1…n) (9 )

Звича йно, ми не зможемо отримати

dG(a,b)/da = 0

dG(a,b)/db = 0

dG(a,b)/da = -2S ((y_i - a x_i –b) x_i) =0

dG(a,b)/db = -2S ((y_i - a x_i –b) =0

S1 –bS2 = aS3

S4 –bn =aS2

Графічна інтерпретація апроксимації

Ця функціональна (аналітична) залежність повинна з достатньою точністю відповідати початковій табличній залежності. Критерієм точності для досягнення «хорошого» наближення можуть слугувати декілька умов.

Позначимо через f_iзначення, обчислене з функціональної залежності для x = x_i,та співставимо з y_i.Одну з умов узгодження можна записати так:

S = (f_i-y_i)  min ,

тобто, сума відхилень табличних та функціональних значень для однакових x=x_i повинна бути мінімальною (метод середніх). Відхилення можуть мати різні знаки, тому достатня точність в ряді випадків не досягається.

Використання критерію S =S|f_i-y_i|  min , також неприпустимо, оскільки абсолютне значення не має похідної в точці мінімуму.

Тому використовують критерій найменших квадратів, тобто визначають таку функціональну залежність, за якої сума квадратів похибок має мінімум:

min S = min å(f_i-y_i)² , (1)

В якості функціональної залежності розглянемо поліном:

f(x)=C₀+ C₁X+C₂X²+...+C_MX^M. (2)

Формула (1) має вигляд S = ( C₀+ C₁X_i+C₂X_i²+...+C_MX_i^M - Y_i) ²

Умови мінімуму S можна записати, прирівнюючи часткові похідні S за незалежними змінними С_0,С₁,...С_М :

S_C0 = 2 ( C₀+ C₁ X_i+C₂ X_i²+...+C_M X_i^M - Y_i) = 0 ,

S_C1 = 2 ( C₀+ C₁ X_i+C₂ X_i²+...+C_M X_i^M - y_i) X_i = 0 , (3)

S_CM = 2 ( C₀+ C₁ X_i+C₂ X_i²+...+C_M X_i^M - Y_i) X_i^M = 0 ,

Тоді з (3) можна отримати систему нормальних рівнянь.

C₀ (N+1) + C₁× X_i + C₂× X_i² +...+ C_M× X_i^M = Y_i ,

C₀× X_i + C₁× X_i² + C₂× X_i³ +...+ C_M× X_i^M+1 = Y_i X_i ,

× × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × × (4)

C₀× X_i^M + C₁× X_i^M+1 + C₂× X_i^M+2 +...+ C_M× X_i^2M = Y_i X_i^M .

Для визначення коефіцієнтів С_i, та таким чином шуканої залежності (2), необхідно обчислити суми та вирішити систему рівнянь (4). Матриця системи (4) називається матрицею Грама та є симетричною та додатною відносно визначеної. Ці корисні властивості використовуються при її розв’язанні.

(N+1) X_i X_i² ... X_i^M Y_i

X_i X_i² X_i³ ... X_i^M+1 Y_i X_i

... ... ... ... ... ...

X_i^M X_i^M+1 X_i^M+2 ... X_i^2M Y_i X_i^M

Неважко побачити, що для формування розширеної матриці (4а) достатньо обчислити тільки елементи першого рядка та двох останніх стовпців, усі інші елементи не є «оригінальними» та заповнюються за допомогою циклічного присвоєння.

Найпростіша залежність – лінійна,

Дата добавления: 2014-12-23; просмотров: 302; Мы поможем в написании вашей работы!; Нарушение авторских прав

⇐ Предыдущая 55 56 57 58 596061 62 63 64 Следующая ⇒

lektsii.com - Лекции.Ком - 2014-2026 год. (0.618 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты