Najmanjši kvadrati

Iz Wikipedije, proste enciklopedije
(Preusmerjeno s strani Metoda najmanjših kvadratov)
Rezultat prilagajanja niza podatkovnih točk s kvadratno funkcijo
Konično prileganje nabora točk z uporabo približka najmanjših kvadratov

Metoda najmanjših kvadratov je standardni pristop v regresijski analizi za približek rešitve predeterminiranih sistemov (nizov enačb, v katerih je več enačb kot neznank) z minimiziranjem vsote kvadratov rezidualov (rezidual je razlika med opazovano vrednostjo in ocenjeno vrednostjo, ki jo zagotavlja model), narejeno na podlagi rezultata vsake posamezne enačbe.

Najpomembnejša uporaba je pri prilagajanju podatkov. Kadar ima problem precejšnjo negotovost neodvisne spremenljivke (spremenljivka x), se pojavijo težave pri preprostih regresijskih modelih in metodah najmanjših kvadratov. V takih primerih se lahko za problem prilagajanja podatkov namesto metodologije najmanjših kvadratov uporabi metodologijo modelov napak v spremenljivkah.

Problem najmanjših kvadratov se lahko deli v dve kategoriji: linearni ali navadni najmanjši kvadrati in nelinearni najmanjši kvadrati, odvisno od tega, ali so reziduali linearni pri vseh neznankah ali ne. Linearni problem najmanjših kvadratov se pojavlja pri statistični regresijski analizi, kjer obstaja rešitev eksplicitne oblike. Nelinearni problem se običajno reši z iterativnim izboljševanjem, kjer je pri vsaki iteraciji sistem aproksimiran z linearnim, zato je osnovni izračun v obeh primerih podoben.

Opis problema[uredi | uredi kodo]

Cilj je prilagajanje parametrov funkcije modela, da se najbolje prilegajo naboru podatkov. Preprost nabor podatkov je sestavljen iz n točk (parov podatkov) , i = 1, …, n, kjer je neodvisna spremenljivka in odvisna spremenljivka, katere vrednost se ugotovi z opazovanjem. Funkcija modela ima obliko , kjer je v vektorju shranjenih m nastavljivih parametrov . Cilj je najti vrednosti parametrov za model, ki se "najboljše" prilega podatkom. Prileganje modela podatkovni točki se meri z njegovim rezidualom, opredeljenim kot razlika med opazovano vrednostjo odvisne spremenljivke in vrednostjo, ki jo napoveduje model:

Reziduali so prikazani z ustreznimi vrednostmi. Naključna nihanja okoli kažejo, da je linearni model primeren.

Metoda najmanjših kvadratov najde optimalne vrednosti parametrov z minimiziranjem vsote kvadratov rezidualov,  : [1]

Reševanje problema najmanjših kvadratov[uredi | uredi kodo]

Najmanjšo vsoto kvadratov najdemo z enačenjem gradienta z nič. Ker model vsebuje m parametrov, obstaja m gradientnih enačb:

in ker postanejo gradientne enačbe
Enačbe gradienta veljajo za vse probleme najmanjših kvadratov. Vsak poseben problem zahteva posebne izraze za model in njegove parcialne odvode. [2]

Linearni najmanjši kvadrati[uredi | uredi kodo]

Regresijski model je linearen, ko model obsega linearno kombinacijo parametrov, tj.

kjer je funkcija odvisna od .[2]

Predpostavimo in nato vstavimo neodvisne in odvisne spremenljivke v matriki in . Najmanjše kvadrate lahko izračunamo na sledeč način. Upoštevajte, da je množica vseh podatkov. [2][3]

Gradient kriterijske funkcije je:
Gradient kriterijske funkcije enačimo z nič in nato rešimo za in tako dobimo:[2][3]

Sklici[uredi | uredi kodo]

  1. A modern introduction to probability and statistics: understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.{{navedi knjigo}}: Vzdrževanje CS1: drugo (povezava)
  2. 2,0 2,1 2,2 2,3 Williams, Jeffrey H. (Jeffrey Huw), 1956- (november 2016). Quantifying measurement: the tyranny of numbers. Morgan & Claypool Publishers, Institute of Physics (Great Britain). San Rafael [California] (40 Oak Drive, San Rafael, CA, 94903, USA). ISBN 978-1-68174-433-9. OCLC 962422324.{{navedi knjigo}}: Vzdrževanje CS1: lokacija (povezava) Vzdrževanje CS1: samodejni prevod datuma (povezava) Vzdrževanje CS1: več imen: seznam avtorjev (povezava)
  3. 3,0 3,1 Rencher, Alvin C.; Christensen, William F. (15. avgust 2012). Methods of Multivariate Analysis (v angleščini). John Wiley & Sons. str. 155. ISBN 978-1-118-39167-9.