Апроксимацията на експериментални данни е метод, основан на заместване на експериментално получени данни аналитична функциянай-близко преминаващи или съвпадащи в възлови точки с първоначалните стойности (данни, получени по време на експеримента или експеримента). Понастоящем има два начина за дефиниране на аналитична функция:

Чрез конструиране на интерполационен полином от n степен, който преминава директно през всички точкидаден масив от данни. В този случай апроксимиращата функция се представя под формата на: интерполационен полином във форма на Лагранж или интерполационен полином във форма на Нютон.

Чрез конструиране на апроксимиращ полином от n-степен, който преминава в най-близка близост до точкиот даден масив от данни. По този начин функцията за приближаване изглажда всички произволни шумове (или грешки), които могат да възникнат по време на експеримента: измерените стойности по време на експеримента зависят от случайни фактори, които се колебаят според собствените си случайни закони(грешки при измерване или уред, неточност или експериментални грешки). В този случай апроксимиращата функция се определя чрез метода на най-малките квадрати.

Метод на най-малките квадрати(в англоезичната литература Ordinary Least Squares, OLS) е математически метод, основан на определяне на апроксимираща функция, която се конструира в най-близка близост до точки от даден масив от експериментални данни. Близостта на оригиналната и апроксимиращата функция F(x) се определя от числена мярка, а именно: сумата от квадратите на отклоненията на експерименталните данни от апроксимиращата крива F(x) трябва да бъде най-малката.

Апроксимираща крива, конструирана чрез метода на най-малките квадрати

Използва се методът на най-малките квадрати:

За решаване на свръхопределени системи от уравнения, когато броят на уравненията надвишава броя на неизвестните;

За намиране на решение в случай на обикновен (неотменен) нелинейни системиуравнения;

За приближаване на точкови стойности с някаква апроксимираща функция.

Апроксимиращата функция с помощта на метода на най-малките квадрати се определя от условието за минималната сума на квадратите на отклоненията на изчислената апроксимираща функция от даден масив от експериментални данни. Този критерий на метода на най-малките квадрати се записва като следния израз:

Стойностите на изчислената апроксимираща функция в възловите точки,

Даден масив от експериментални данни в възлови точки.

Квадратният критерий има редица „добри“ свойства, като например диференцируемост, предоставяйки уникално решение на проблема с приближението с полиномиални апроксимиращи функции.

В зависимост от условията на задачата, апроксимиращата функция е полином от степен m

Степента на апроксимиращата функция не зависи от броя на възловите точки, но размерът й винаги трябва да бъде по-малък от размерността (броя точки) на даден експериментален масив от данни.

∙ Ако степента на апроксимиращата функция е m=1, тогава апроксимираме табличната функция с права линия (линейна регресия).

∙ Ако степента на апроксимиращата функция е m=2, тогава апроксимираме табличната функция с квадратна парабола (квадратично приближение).

∙ Ако степента на апроксимиращата функция е m=3, тогава апроксимираме табличната функция с кубична парабола (кубична апроксимация).

В общия случай, когато е необходимо да се построи апроксимиращ полином от степен m за дадени таблични стойности, условието за минимум на сумата на квадратите на отклоненията по всички възлови точки се пренаписва в следния вид:

- неизвестни коефициенти на апроксимиращия полином от степен m;

Броят на зададените стойности на таблицата.

Необходимо условие за съществуването на минимум на функция е равенството на нула на нейните частни производни по отношение на неизвестни променливи . В резултат на това получаваме следната система от уравнения:

Нека трансформираме получената линейна система от уравнения: отворете скобите и преместете свободните членове в дясната страна на израза. В резултат на това получената система от линейни алгебрични изрази ще бъде записана в следната форма:

Тази система от линейни алгебрични изрази може да бъде пренаписана в матрична форма:

Резултатът беше система линейни уравненияизмерение m+1, което се състои от m+1 неизвестни. Тази система може да бъде решена с помощта на всеки метод за решаване на линейни проблеми. алгебрични уравнения(например по метода на Гаус). В резултат на решението ще бъдат намерени неизвестни параметри на апроксимиращата функция, които осигуряват минималната сума на квадратите на отклоненията на апроксимиращата функция от оригиналните данни, т.е. най-доброто възможно квадратично приближение. Трябва да се помни, че ако дори една стойност на изходните данни се промени, всички коефициенти ще променят стойностите си, тъй като те са напълно определени от изходните данни.

Апроксимация на изходни данни чрез линейна зависимост

(линейна регресия)

Като пример, нека разгледаме техниката за определяне на апроксимиращата функция, която е посочена под формата на линейна зависимост. В съответствие с метода на най-малките квадрати условието за минимум на сумата от квадратите на отклоненията се записва в следната форма:

Координати на възлите на таблицата;

Неизвестни коефициенти на апроксимиращата функция, която е зададена като линейна зависимост.

Необходимо условие за съществуването на минимум на функция е равенството на нула на нейните частни производни по отношение на неизвестни променливи. В резултат на това получаваме следната система от уравнения:

Нека трансформираме получената линейна система от уравнения.

Решаваме получената система от линейни уравнения. Коефициентите на апроксимиращата функция в аналитична форма се определят, както следва (метод на Крамер):

Тези коефициенти осигуряват изграждането на линейна апроксимираща функция в съответствие с критерия за минимизиране на сумата от квадратите на апроксимиращата функция от дадените таблични стойности (експериментални данни).

Алгоритъм за прилагане на метода на най-малките квадрати

1. Изходни данни:

Посочен е масив от експериментални данни с брой измервания N

Посочва се степента на апроксимиращия полином (m).

2. Алгоритъм за изчисление:

2.1. Определят се коефициентите за построяване на система от уравнения с размерности

Коефициенти на системата от уравнения (лявата страна на уравнението)

- индекс на номера на колоната на квадратната матрица на системата от уравнения

Свободни членове на система от линейни уравнения (дясната страна на уравнението)

- индекс на номера на реда на квадратната матрица на системата от уравнения

2.2. Образуване на система от линейни уравнения с размерност .

2.3. Решаване на система от линейни уравнения за определяне на неизвестните коефициенти на апроксимиращ полином от степен m.

2.4 Определяне на сумата от квадратите на отклоненията на апроксимиращия полином от първоначалните стойности във всички възлови точки

Намерената стойност на сумата от квадратите на отклоненията е минимално възможната.

Апроксимация с помощта на други функции

Трябва да се отбележи, че когато се апроксимират оригиналните данни в съответствие с метода на най-малките квадрати, логаритмичната функция, експоненциалната функция и степенната функция понякога се използват като апроксимираща функция.

Логаритмично приближение

Нека разгледаме случая, когато е дадена апроксимиращата функция логаритмична функцияТип:

Метод на най-малките квадратиизползвани за оценка на параметрите на регресионното уравнение.

Един от методите за изследване на стохастичните връзки между характеристиките е регресионният анализ.
Регресионният анализ е извеждането на регресионно уравнение, с помощта на което се намира средната стойност на случайна променлива (резултатен атрибут), ако е известна стойността на друга (или други) променливи (факторни атрибути). Тя включва следните стъпки:

  1. избор на формата на връзка (тип уравнение на аналитична регресия);
  2. оценка на параметрите на уравнението;
  3. оценка на качеството на аналитичното регресионно уравнение.
Най-често се използва за описание на статистическата връзка на характеристиките линейна форма. Фокусът върху линейните зависимости се обяснява с ясната икономическа интерпретация на неговите параметри, ограничената вариация на променливите и факта, че в повечето случаи нелинейните форми на зависимости се преобразуват (чрез логаритъм или заместване на променливи) в линейна форма за извършване на изчисления .
В случай на линейна връзка по двойки, регресионното уравнение ще приеме формата: y i =a+b·x i +u i . Параметрите a и b на това уравнение се оценяват от данните от статистическите наблюдения x и y. Резултатът от такава оценка е уравнението: , където , са оценки на параметрите a и b , е стойността на резултантния атрибут (променлива), получена от регресионното уравнение (изчислена стойност).

Най-често се използва за оценка на параметри метод на най-малките квадрати (LSM).
Методът на най-малките квадрати предоставя най-добрите (последователни, ефективни и безпристрастни) оценки на параметрите на регресионното уравнение. Но само ако са изпълнени определени допускания относно произволния член (u) и независимата променлива (x) (вижте допусканията на OLS).

Проблемът за оценяване на параметрите на уравнение на линейна двойка с помощта на метода на най-малките квадратие както следва: да се получат такива оценки на параметрите , , при които сумата от квадратните отклонения на действителните стойности на резултантната характеристика - y i от изчислените стойности - е минимална.
Формално OLS тестможе да се напише така: .

Класификация на методите на най-малките квадрати

  1. Метод на най-малките квадрати.
  2. Метод на максималното правдоподобие (за нормален класически линеен регресионен модел се постулира нормалност на регресионните остатъци).
  3. Обобщеният метод на най-малките квадрати OLS се използва в случай на автокорелация на грешки и в случай на хетероскедастичност.
  4. Метод на най-малките претеглени квадрати ( специален случай OLS с хетероскедастични остатъци).

Нека илюстрираме идеята класически метод на най-малките квадрати графично. За да направим това, ще изградим диаграма на разсейване въз основа на данни от наблюдения (x i, y i, i=1;n) в правоъгълна системакоординати (такъв точков график се нарича корелационно поле). Нека се опитаме да изберем права линия, която е най-близо до точките на корелационното поле. По метода на най-малките квадрати линията се избира така, че сумата от квадратите на вертикалните разстояния между точките на корелационното поле и тази линия да е минимална.

Математическа нотация за този проблем: .
Стойностите на y i x i =1...n са ни известни; това са данни от наблюдения. Във функцията S те представляват константи. Променливите в тази функция са необходимите оценки на параметрите - , . За да се намери минимумът на функция на две променливи, е необходимо да се изчислят частните производни на тази функция за всеки от параметрите и да се приравнят към нула, т.е. .
В резултат на това получаваме система от 2 нормални линейни уравнения:
Решавайки тази система, намираме необходимите оценки на параметрите:

Правилността на изчислението на параметрите на регресионното уравнение може да се провери чрез сравняване на сумите (може да има известно несъответствие поради закръгляване на изчисленията).
За да изчислите оценките на параметрите, можете да съставите таблица 1.
Знакът на регресионния коефициент b показва посоката на връзката (ако b >0, връзката е пряка, ако b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Формално стойността на параметър a е средната стойност на y с x равно на нула. Ако атрибут-факторът няма и не може да има нулева стойност, тогава горната интерпретация на параметър a няма смисъл.

Оценяване на близостта на връзката между характеристиките извършва се с помощта на корелационния коефициент на линейна двойка - r x,y. Може да се изчисли по формулата: . Освен това корелационният коефициент на линейната двойка може да се определи чрез регресионния коефициент b: .
Диапазонът на приемливите стойности на коефициента на корелация на линейната двойка е от –1 до +1. Знакът на коефициента на корелация показва посоката на връзката. Ако r x, y >0, тогава връзката е директна; ако r x, y<0, то связь обратная.
Ако този коефициент е близък до единица по величина, тогава връзката между характеристиките може да се тълкува като доста близка линейна. Ако неговият модул е ​​равен на единица ê r x , y ê =1, то връзката между характеристиките е функционално линейна. Ако характеристиките x и y са линейно независими, тогава r x,y е близо до 0.
За да изчислите r x,y, можете също да използвате таблица 1.

За да оцените качеството на полученото регресионно уравнение, изчислете теоретичния коефициент на детерминация - R 2 yx:

,
където d 2 е дисперсията на y, обяснена от регресионното уравнение;
e 2 - остатъчна (необяснена от регресионното уравнение) дисперсия на y;
s 2 y - обща (обща) дисперсия на y.
Коефициентът на детерминация характеризира съотношението на вариация (дисперсия) на резултантния атрибут y, обяснено чрез регресия (и, следователно, фактор x) в общата вариация (дисперсия) y. Коефициентът на определяне R 2 yx приема стойности от 0 до 1. Съответно стойността 1-R 2 yx характеризира съотношението на дисперсията y, причинена от влиянието на други фактори, които не са взети предвид в модела и грешките в спецификацията.
При сдвоена линейна регресия, R 2 yx =r 2 yx.

След изравняване получаваме функция от следния вид: g (x) = x + 1 3 + 1 .

Можем да апроксимираме тези данни, като използваме линейната връзка y = a x + b чрез изчисляване на съответните параметри. За да направим това, ще трябва да приложим така наречения метод на най-малките квадрати. Ще трябва също да направите чертеж, за да проверите коя линия ще подравни най-добре експерименталните данни.

Какво точно е OLS (метод на най-малките квадрати)

Основното, което трябва да направим, е да намерим такива коефициенти на линейна зависимост, при които стойността на функцията на две променливи F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 ще бъде най-малък. С други думи, за определени стойности на a и b, сумата от квадратните отклонения на представените данни от получената права линия ще има минимална стойност. Това е смисълът на метода на най-малките квадрати. Всичко, което трябва да направим, за да решим примера, е да намерим екстремума на функцията на две променливи.

Как да изведем формули за изчисляване на коефициентите

За да изведете формули за изчисляване на коефициентите, трябва да създадете и решите система от уравнения с две променливи. За да направим това, ние изчисляваме частните производни на израза F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 по отношение на a и b и ги приравняваме към 0.

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

За да решите система от уравнения, можете да използвате всякакви методи, например заместване или метод на Крамер. В резултат на това трябва да имаме формули, които могат да се използват за изчисляване на коефициенти чрез метода на най-малките квадрати.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Изчислихме стойностите на променливите, при които функцията
F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 ще приеме минималната стойност. В трети параграф ще докажем защо е точно така.

Това е приложението на метода на най-малките квадрати на практика. Неговата формула, която се използва за намиране на параметъра a, включва ∑ i = 1 n x i, ∑ i = 1 n y i, ∑ i = 1 n x i y i, ∑ i = 1 n x i 2, както и параметъра
n – обозначава количеството експериментални данни. Съветваме ви да изчислявате всяка сума поотделно. Стойността на коефициента b се изчислява непосредствено след a.

Да се ​​върнем към оригиналния пример.

Пример 1

Тук имаме n равно на пет. За да направим по-удобно изчисляването на необходимите суми, включени във формулите на коефициента, нека попълним таблицата.

i = 1 i=2 i=3 i=4 i=5 ∑ i = 1 5
x i 0 1 2 4 5 12
y i 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Решение

Четвъртият ред включва данните, получени чрез умножаване на стойностите от втория ред по стойностите на третия за всеки отделен i. Петият ред съдържа данните от втория, на квадрат. Последната колона показва сумите на стойностите на отделните редове.

Нека използваме метода на най-малките квадрати, за да изчислим коефициентите a и b, от които се нуждаем. За да направите това, заменете необходимите стойности от последната колона и изчислете сумите:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Оказва се, че необходимата апроксимираща права линия ще изглежда като y = 0, 165 x + 2, 184. Сега трябва да определим кой ред ще приближи по-добре данните - g (x) = x + 1 3 + 1 или 0, 165 x + 2, 184. Нека оценим с помощта на метода на най-малките квадрати.

За да изчислим грешката, трябва да намерим сумата от квадратите на отклоненията на данните от правите линии σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 и σ 2 = ∑ i = 1 n (y i - g (x i)) 2, минималната стойност ще съответства на по-подходящ ред.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0, 165 x i + 2, 184)) 2 ≈ 0, 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0,096

Отговор:тъй като σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0,165 x + 2,184.

Методът на най-малките квадрати е ясно показан на графичната илюстрация. Червената линия маркира правата линия g (x) = x + 1 3 + 1, синята линия маркира y = 0, 165 x + 2, 184. Оригиналните данни са обозначени с розови точки.

Нека обясним защо са необходими точно приближения от този тип.

Те могат да се използват в задачи, които изискват изглаждане на данни, както и в такива, при които данните трябва да бъдат интерполирани или екстраполирани. Например, в проблема, обсъден по-горе, може да се намери стойността на наблюдаваното количество y при x = 3 или при x = 6. На такива примери сме посветили отделна статия.

Доказателство за метода OLS

За да може функцията да приеме минимална стойност, когато се изчисляват a и b, е необходимо в дадена точка матрицата на квадратичната форма на диференциала на функцията под формата F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 е положително определено. Нека ви покажем как трябва да изглежда.

Пример 2

Имаме диференциал от втори ред от следната форма:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2 б

Решение

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

С други думи, можем да го запишем така: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b.

Получихме матрица с квадратична форма M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

В този случай стойностите на отделните елементи няма да се променят в зависимост от a и b. Тази матрица положително определена ли е? За да отговорим на този въпрос, нека проверим дали неговите ъглови минори са положителни.

Изчисляваме ъгловия минор от първи ред: 2 ∑ i = 1 n (x i) 2 > 0 . Тъй като точките x i не съвпадат, неравенството е строго. Ще имаме това предвид при по-нататъшни изчисления.

Изчисляваме второстепенния ъглов минор:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

След това пристъпваме към доказване на неравенството n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 с помощта на математическа индукция.

  1. Нека проверим дали това неравенство е валидно за произволно n. Нека вземем 2 и изчислим:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Получихме правилно равенство (ако стойностите x 1 и x 2 не съвпадат).

  1. Нека направим предположението, че това неравенство ще бъде вярно за n, т.е. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – вярно.
  2. Сега ще докажем валидността за n + 1, т.е. че (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0, ако n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Изчисляваме:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

Изразът, ограден във фигурни скоби, ще бъде по-голям от 0 (въз основа на това, което предположихме в стъпка 2), а останалите членове ще бъдат по-големи от 0, тъй като всички те са квадрати от числа. Доказахме неравенството.

Отговор:намерените a и b ще съвпаднат най-ниска стойностфункции F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, което означава, че те са желаните параметри на метода на най-малките квадрати (LSM).

Ако забележите грешка в текста, моля, маркирайте я и натиснете Ctrl+Enter

  • Въвеждащ урок безплатно;
  • Голямо числоопитни учители (с роден и руски език);
  • Курсовете НЕ са за определен период (месец, шест месеца, година), а за определен брой уроци (5, 10, 20, 50);
  • Повече от 10 000 доволни клиенти.
  • Цената на един урок с рускоезичен учител е от 600 рубли, с носител на езика - от 1500 рубли

Същността на метода на най-малките квадрати е при намиране на параметрите на модел на тенденция, който най-добре описва тенденцията на развитие на всяко случайно явление във времето или пространството (тенденцията е линия, която характеризира тенденцията на това развитие). Задачата на метода на най-малките квадрати (LSM) се свежда до намирането не просто на някакъв трендов модел, а до намирането на най-добрия или оптимален модел. Този модел ще бъде оптимален, ако сумата от квадратните отклонения между наблюдаваните действителни стойности и съответните изчислени стойности на тенденцията е минимална (най-малка):

където е квадратното отклонение между наблюдаваната действителна стойност

и съответната изчислена стойност на тренда,

Действителната (наблюдавана) стойност на изследваното явление,

Изчислената стойност на модела на тренда,

Броят на наблюденията на изследваното явление.

MNC се използва доста рядко самостоятелно. По правило най-често се използва само като необходимост технически приемв корелационни изследвания. Трябва да се помни, че информационната база на MNC може да бъде само надеждна статистически серии, а броят на наблюденията не трябва да бъде по-малък от 4, в противен случай процедурите за изглаждане на OLS могат да загубят здрав разум.

Инструментариумът на MNC се свежда до следните процедури:

Първа процедура. Оказва се дали изобщо има тенденция за промяна на резултатния атрибут при промяна на избрания фактор-аргумент, или с други думи, има ли връзка между „ при " И " х ».

Втора процедура. Определя се коя линия (траектория) може най-добре да опише или характеризира тази тенденция.

Трета процедура.

Пример. Да кажем, че имаме информация за средния добив на слънчоглед за изследваната ферма (Таблица 9.1).

Таблица 9.1

Номер на наблюдение

Производителност, c/ha

Тъй като нивото на технологията на производството на слънчоглед у нас остава почти непроменено през последните 10 години, това означава, че очевидно колебанията в добива през анализирания период са били силно зависими от колебанията в метеорологичните и климатичните условия. Това наистина ли е вярно?

Първа OLS процедура. Тества се хипотезата за наличие на тенденция в изменението на добива от слънчоглед в зависимост от промените в метеорологичните и климатичните условия през анализираните 10 години.

IN в този примерзад " г " препоръчително е да се вземе добивът от слънчоглед, а за " х » – номер на наблюдаваната година в анализирания период. Проверка на хипотезата за съществуването на някаква връзка между " х " И " г "може да се направи по два начина: ръчно и с помощта на компютърни програми. Разбира се, с наличието на компютърни технологии, този проблем може да бъде решен сам. Но за да разберем по-добре инструментите на MNC, е препоръчително да тестваме хипотезата за съществуването на връзка между „ х " И " г » ръчно, когато само писалка и обикновен калкулатор. В такива случаи хипотезата за наличието на тенденция се проверява най-добре визуално чрез местоположението на графичното изображение на анализираната поредица от динамика - корелационното поле:

Корелационното поле в нашия пример е разположено около бавно нарастваща линия. Това само по себе си говори за наличието на определена тенденция в изменението на добивите от слънчоглед. Невъзможно е да се говори за наличие на някаква тенденция само когато корелационното поле изглежда като кръг, кръг, строго вертикален или строго хоризонтален облак или се състои от хаотично разпръснати точки. Във всички останали случаи хипотезата за наличието на връзка между „ х " И " г “, и продължете проучването.

Втора OLS процедура. Определя се коя линия (траектория) може най-добре да опише или характеризира тенденцията на изменение на добива на слънчоглед през анализирания период.

Ако имате компютърна технология, изборът на оптималната тенденция става автоматично. При ръчна обработка изборът оптимална функциясе извършва, като правило, визуално - чрез местоположението на корелационното поле. Това означава, че въз основа на типа графика се избира уравнението на линията, което най-добре отговаря на емпиричния тренд (действителната траектория).

Както е известно, в природата има огромно разнообразие от функционални зависимости, така че е изключително трудно да се анализира визуално дори малка част от тях. За щастие в реалната икономическа практика повечето отношения могат да бъдат описани доста точно или с парабола, или с хипербола, или с права линия. В тази връзка с опцията „ръчно“ за избор на най-добра функция можете да се ограничите само до тези три модела.

Хипербола:

Парабола от втори ред: :

Лесно се вижда, че в нашия пример тенденцията на изменение на добива на слънчоглед през анализираните 10 години се характеризира най-добре с права линия, така че регресионното уравнение ще бъде уравнението на правата линия.

Трета процедура. Изчисляват се параметрите на регресионното уравнение, характеризиращо тази линия, или с други думи се определя аналитична формула, която описва най-добрия трендов модел.

Намирането на стойностите на параметрите на регресионното уравнение, в нашия случай параметрите и , е ядрото на OLS. Този процес се свежда до решаване на система от нормални уравнения.

(9.2)

Тази система от уравнения може да се реши доста лесно по метода на Гаус. Нека си припомним, че в резултат на решението в нашия пример се намират стойностите на параметрите и . По този начин намереното регресионно уравнение ще има следната форма:

Ако някои физическо количествозависи от друга величина, тогава тази зависимост може да се изследва чрез измерване на y при различни значениях. В резултат на измерванията се получават редица стойности:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Въз основа на данните от такъв експеримент е възможно да се построи графика на зависимостта y = ƒ(x). Получената крива позволява да се прецени формата на функцията ƒ(x). Въпреки това, постоянните коефициенти, които влизат в тази функция, остават неизвестни. Те могат да бъдат определени чрез метода на най-малките квадрати. Експерименталните точки по правило не лежат точно на кривата. Методът на най-малките квадрати изисква сумата от квадратите на отклоненията на експерименталните точки от кривата, т.е. 2 беше най-малкият.

На практика този метод най-често (и най-просто) се използва в случай на линейна зависимост, т.е. Кога

y = kxили y = a + bx.

Линейната зависимост е много разпространена във физиката. И дори когато връзката е нелинейна, те обикновено се опитват да построят графика, така че да получат права линия. Например, ако се приеме, че коефициентът на пречупване на стъклото n е свързан с дължината на светлинната вълна λ чрез връзката n = a + b/λ 2, тогава зависимостта на n от λ -2 се нанася на графиката.

Помислете за зависимостта y = kx(права линия, минаваща през началото). Нека съставим стойността φ сумата от квадратите на отклоненията на нашите точки от правата линия

Стойността на φ винаги е положителна и се оказва по-малка, колкото по-близо са нашите точки до правата линия. Методът на най-малките квадрати гласи, че стойността за k трябва да бъде избрана така, че φ да има минимум


или
(19)

Изчислението показва, че средноквадратичната грешка при определяне на стойността на k е равна на

, (20)
където n е броят на измерванията.

Нека сега разгледаме един малко по-сложен случай, когато точките трябва да удовлетворяват формулата y = a + bx(права линия, която не минава през началото).

Задачата е да се намерят най-добрите стойности на a и b от наличния набор от стойности x i, y i.

Нека отново съставим квадратната форма φ, равно на суматаквадратни отклонения на точки x i, y i от правата линия

и намерете стойностите на a и b, за които φ има минимум

;

.

.

Съвместното решение на тези уравнения дава

(21)

Средните квадратични грешки при определяне на a и b са равни

(23)

.  (24)

При обработката на резултатите от измерванията по този метод е удобно да се обобщят всички данни в таблица, в която всички суми, включени във формули (19)(24), са предварително изчислени. Формите на тези таблици са дадени в примерите по-долу.

Пример 1.Изследва се основното уравнение на динамиката въртеливо движениеε = M/J (линия, минаваща през началото). При различни стойности на момента M се измерва ъгловото ускорение ε на определено тяло. Необходимо е да се определи инерционният момент на това тяло. Резултатите от измерванията на момента на силата и ъгловото ускорение са изброени във втората и третата колона таблица 5.

Таблица 5
н M, N m ε, s -1 М 2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Използвайки формула (19), определяме:

.

За да определим средната квадратична грешка, използваме формула (20)

0.005775килограма-1 · м -2 .

Съгласно формула (18) имаме

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

След като зададем надеждността P = 0,95, използвайки таблицата на коефициентите на Студент за n = 5, намираме t = 2,78 и определяме абсолютната грешка ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Нека запишем резултатите във формата:

J = (3,0 ± 0,2) kg m2;


Пример 2.Нека изчислим температурния коефициент на съпротивление на метала, използвайки метода на най-малките квадрати. Съпротивлението зависи линейно от температурата

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Свободният термин определя съпротивлението R 0 при температура 0 ° C, а ъгловият коефициент е продуктът температурен коефициентα към съпротивление R 0 .

Резултатите от измерванията и изчисленията са дадени в таблицата ( виж таблица 6).

Таблица 6
н t°, s r, Ом t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Използвайки формули (21), (22) определяме

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ом.

Нека намерим грешка в дефиницията на α. Тъй като , то съгласно формула (18) имаме:

.

Използвайки формули (23), (24) имаме

;

0.014126 Ом.

След като зададем надеждността на P = 0.95, използвайки таблицата на коефициентите на Student за n = 6, намираме t = 2.57 и определяме абсолютната грешка Δα = 2.57 0.000132 = 0.000338 градус -1.

α = (23 ± 4) 10 -4 градушка-1 при Р = 0,95.


Пример 3.Необходимо е да се определи радиусът на кривината на лещата с помощта на пръстените на Нютон. Бяха измерени радиусите на Нютоновите пръстени r m и бяха определени номерата на тези пръстени m. Радиусите на пръстените на Нютон са свързани с радиуса на кривината на лещата R и номера на пръстена чрез уравнението

r 2 m = mλR - 2d 0 R,

където d 0 дебелината на празнината между лещата и плоско-паралелната плоча (или деформацията на лещата),

λ дължина на вълната на падащата светлина.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

тогава уравнението ще приеме формата y = a + bx.

.

Резултатите от измерванията и изчисленията се въвеждат таблица 7.

Таблица 7
н x = m y = r 2, 10 -2 mm 2 m -¯ m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –