Izogonális (6)
Gondolatok a legkisebb négyzetek módszeréről
Az első lapon (Izogonális (1)) említettem, hogy az alapfeladatnak számos
átalakítása, kibővítése, kiterjesztése lehetséges. Említettem, hogy egy pont
helyett kereshetnénk egyenest is, azaz:
A feladat: Adott a síkban n darab pont. Adjuk meg azt az egyenest ebben a síkban, amelytől az
adott pontok távolságösszege minimális. (Ez is IMT, csak pont helyett most egyenest keresünk.)
Pontok és egyenesek egy
síkon és valami minimális!? Ezek alapján eszünkbe
juthat a valószínűség számításból jól ismert:
Gauss - Markov-tétel: Ha az x és y véletlen mennyiségek között lineáris kapcsolatot tételezünk fel, azaz
egy y = a*x + b egyenessel
közelítjük, akkor az a
és b paramétereknek a legkisebb
négyzetek módszerével kapott becslései az összes lineáris becslések között a
legkisebb szórásúak.
A legkisebb négyzetek
módszerénél az egyenes egyenletében található a és b értékét úgy választjuk meg, hogy a
négyzetösszeg, a lehető legkisebb
legyen. Egy konkrét feladattal kapcsolatban arra van szükség, hogy az a és b konstansokat meghatározzuk. Az D egyenletéből adódó Gauss-féle normálegyenletek a-ra és b-re lineáris
egyenletrendszert adnak, melyek könnyen megoldhatók. Az eredmények a
következők: Ha
és ,
azaz a véletlen x és y mennyiségek
átlagai, akkor az egyenes a és b
paraméterét így kapjuk:
és
Jelen lapon azt vizsgálom,
hogy ha a legkisebb négyzetek módszere helyett lineáris közelítést alkalmazunk
(azaz nem az y szerinti eltérések
négyzetével, hanem az egyenestől mért valódi távolságokkal számolunk), akkor ez
milyen eltérést mutat, a közelítő egyenestől vett távolságösszeg minimalizálása
tekintetében.
Térjünk át most a
fentebbi feladathoz (keressünk IMT
egyenest). Mivel a feladat megoldásában csak geometriai, koordináta-geometriai
és analitikus fejtegetések találhatók, csak geometriai oldalról fogalmazzuk és
oldjuk meg a feladatot.
A megoldás:
I. rész: Bebizonyítjuk, hogy ezen az egyenesen rajta van legalább egy
az n pont közül.
Indirekt módon
bizonyítunk.
A lenti ábra alapján:
tegyük fel, hogy e
a keresett egyenes és nincs rajta egyetlen pont sem. Ez pontosan azt jelenti,
hogy e körül e1 és e2-vel
kijelölhető egy 2d szélességű sáv,
melyben nincs pont. Így az e egyenes a pontokat két részre osztja.
a) Ha az egyenes két
oldalán ugyanannyi n/2 pont van (azaz
n páros), akkor az e-vel párhuzamos és az említett sávban
elhelyezkedő egyenesek vele azonosan jó tulajdonságúak sőt, ha P1 van a legközelebb e-hez, akkor a P1-en átmenő e-vel
párhuzamos egyenes is e-vel azonosan
jó tulajdonságú (e').
b)
Ha a két részre szakadt pontok száma nem egyenlő, akkor, ha a P1-el meghatározott oldalon
van több, akkor e-nél minden, a P1 oldalára eső, d sávban lévő, e-vel párhuzamos egyenes jobb tulajdonságú, mint az e (ha mozgatjuk a keresendő egyenest,
akkor több ponthoz kerül közelebb, mint ahánytól távolodott). Nevezetesen, ha
tekintjük a P1-en (mint
legközelebbi ponton) átmenő, e-vel
párhuzamos egyenest, akkor ez, jobb tulajdonságú lesz, mint e.
Így e nem lehet a legjobb tulajdonságú egyenes, ugyanis van nála jobb
(vagy vele azonosan jó) tulajdonságú, amelyre pont illeszkedik. Ezzel beláttuk,
hogy az egyenesnek mindenképp át kell mennie egy ponton az adott n pont közül.
II. rész: Bebizonyítjuk, hogy ezen az egyenesen még egy további
(azaz összesen legalább kettő) pont rajta van a megadott n pont közül.
Az egyenesek és pontok
kölcsönös helyzete, távolsága független a koordináta reprezentációtól. Ezért K0-ban legyenek a
koordináták P0i(ai, bi).
Át fogunk térni minden pontban olyan koordinátarendszerre, melynek középpontja
az illető pont és a tengelyek irány szerint párhuzamosak K0 tengelyeivel. A pontok koordinátái a pontokhoz
rögzített koordinátarendszerekben:
K1-ben a Pi koordinátái P1i(ai-a1, bi-b1),
K2-ben a Pi koordinátái P2i(ai-a2, bi-b2),
.
.
.
Kn-ben a Pi koordinátái Pni(ai-an, bi-bn),
ahol i = 1,2, ... ,n.
Minden
koordinátarendszerben a keresett minimális tulajdonságú egyenes egyenlete a
következő alakban írható fel (mivel átmegy a lokális koordinátarendszer
origóján, mint az egyik ponton az n
közül):
mx - y = 0.
Az egyenletet normál
alakja:
.
Egy adott pont P(x0, y0) tőle vett
távolsága:
,
ahol N(P) a pont koordinátáinak helyettesítési értéke.
Így a j. ponton (j<>i) átmenő egyenestől vett
távolságösszeg:
Ezek után az elvi
megoldás: meghatározzuk minden j
mellett a fenti függvény minimumát. (Itt lényegében n-1 db függvény minimumát kell kiszámítani, hiszen j nem lehet egyenlő i-vel.) Aztán az n-1 minimum érték közül ki kell választani a legkisebbet. Ez lenne
a feladat megoldása, mármint az, hogy milyen i-re lesz a legkisebb, mert akkor az a pont lesz a másik pont, amin
átmegy az egyenes. A fenti függvények szélsőértékének meghatározása az abszolút
érték miatt (ha alakjukat nem változtatjuk meg) nem lehet analitikus. (deriválással
nem lehet a szélső értéket meghatározni). Így nehezen járható ez az elvi
megoldás.
Keressünk nem analitikus
megoldást (persze analitikus eszközökkel).
Belátjuk, hogy a
keresett szélsőérték szempontjából a függvény nevezője nem számít.
A fenti függvény
szakaszonként a következő alakban írható fel:
Vizsgáljuk tehát ez
utóbbi függvényt. A függvény menetének vázolása érdekében képezzük az első
deriváltját:
Ennek zérus-helye:
,
ahol természetesen a b nem lehet nulla.
Az y függvény értéke a deriváltja zérus-helyénél:
Ahol Sgn az előjelfüggvény.
Mivel a minimumhely
környezetében a függvény első deriváltja előjelet vált (a számláló lineáris
függvény, a nevező mindig pozitív), így a függvénynek (ha b<>0) szélsőértéke van. A szélsőérték jellegének és a függvény
menetének megállapítása érdekében vegyük a függvény második deriváltját:
Ennek zérus-helyei:
Az y függvény határértéke a végtelenben:
Vázoljuk a függvény
lehetséges menetét. A fentiek alapján két eset lehetséges:
a) Ha b > 0, akkor az y függvény menete:
-∞ |
< |
x1 |
< |
x2 |
< |
∞ |
|
konvex |
inflexió |
konkáv |
inflexió |
konvex |
|
Ekkor a szélsőérték csak
maximum lehet. Mivel helyi maximum abszolút minimum nem lehet, ez az eset nem
fordulhat elő, mivel minimumot keresünk (a konvexitás alulról értendő).
b) Ha b < 0,
akkor az y függvény menete:
-∞ |
< |
x1 |
< |
x2 |
< |
∞ |
|
konkáv |
inflexió |
konvex |
Inflexió |
konkáv |
|
Ekkor a szélsőérték csak
minimum lehet. Ebben az esetben a felvett minimális érték:
azaz negatív. Mivel a zj
bármely j-re bármely intervallumon
nem negatív, így ez az eset sem fordulhat elő. Azért, hogy a függvény elemzését
szemléltessük és leellenőrizzük, ábrázoljuk a függvényt a következő konkrét
érékekre:
1) a = 3,
b = 2 (A koordináta rendszerben fekete színű grafikon.)
2) a = 3,
b = -2 (A koordináta rendszerben kék színű grafikon.)
3) a =
-3, b = 2 (A koordináta rendszerben lila színű grafikon.)
4) a =
-3, b = -2 (A koordináta rendszerben szürke színű grafikon.)
Az a és b együttható egyéb
megválasztása esetén sem kapunk ezektől különböző menetű függvényeket. Látható,
hogy b>0
esetén a függvénynek valóban maximuma, b<0
esetén pedig minimuma van (ami viszont negatív érték). Mint már korábban említettem
b=0 nem lehet, mert ekkor sincs
szélső érték (nevező nem lehet nulla). Mivel b minden lehetséges esetét végignéztük, azt a következtetést
vonhatjuk le, hogy a zj
függvényeknek egyetlen differenciálható pontjában sem lehet a feladatnak
megfelelő szélső értéke. Ezek a függvények tehát csak töréspontjaiban vehetnek
fel minimumot. Ez pontosan azt jelenti, hogy a j. pont mellett még egy ponton átmegy a
legjobb tulajdonságú egyenes.
Ezek után az egyenes
meghatározásának menete:
Adottak tehát K0-ban a P0i(ai, bi) koordináták.
Képezzük:
K1-ben a P1i(ai-a1, bi-b1),
K2-ben a P2i(ai-a2, bi-b2),
...
Kn-ben a Pni(ai-an, bi-bn)
koordinátákat.
Felírjuk a rendezett:
függvényeket és képezzük belőle a
következőket:
Állítsuk elő ez utóbbi
függvények meredekség-sorozatait:
m11, m12, ...
,m1n+1
m21, m22, ...
,m2n+1
...
mn1, mn2, ...
,mnn+1.
Minden meredekség-sorozat
monoton növekvő, hiszen az abszolút értékes függvények tagjait pozitív előjellel
adjuk össze.
Keressük meg a
meredekség sorozatokban az előjelváltásokat. Ezekben a
töréspontokban behelyettesítjük az x0
= (ai-aj)/(bi-bj)
értékeket és a kapott értéket
értékkel normáljuk. Az így
kapott n szám közül ki kell
választani a legkisebb értékeket (ez legalább két érték és hely lesz). A két
hely (melyet a j határoz meg)
jelenti azt a két pontot, amelyeken átmenő egyenest kerestük. Ha a minimális
értékek száma több mint kettő, akkor a feladatnak több megoldása van.
Ellenőrzés és
demonstráció végett a probléma vizsgálatára számítógépes program is készült. A
próbafuttatások eredményei azt mutatják, hogy minél függvényszerűbb kapcsolat
áll fenn a pontok koordinátái között, a lineáris illesztés és a legkisebb négyzetek
módszere alapján történő illesztés annál kisebb eltérést mutat, egymáshoz
képest. Mindemellett a lineáris illesztésnél a távolságösszeg mindig kisebb,
mint a Gauss illesztésnél. Pontosabban minden olyan esetben, amikor a mérési
eredmények között nincs funkcionális kapcsolat (azaz jelen esetben a pontok nem
esnek egy egyenesre), a lineáris közelítés ad jobb - azaz kisebb -
minimál-összeget. Nézzünk erre néhány futtatási képet. A megjelenítés igen
egyértelmű. Bal oldalt a Gauss, jobb oldalt a Lineáris illesztés látható. Alul
láthatjuk az illesztő egyenesek egyenletét, és a lineáris távolságösszegeket (LT).
Legyen a pontok száma 30.
Mindkét esetben az
eltérés 2% körüli a lineáris
illesztés javára. Nézzünk egy 40
pontos esetet:
Itt az eltérés kisebb,
mint 1%, szintén a lineáris
közelítés javára. Javítsunk a linearitás mértékén,
amellyel a pontoknak az egyenestől való eltérését csökkenthetjük:
Az eltérés kisebb, mint
fél százalék. Tovább csökkentve:
Az eltérés egyre kisebb.
Ha a pontok számát csökkentjük, hasonlóan csökken a különbség:
Természetesen 2 pont esete már funkcionális
kapcsolatot jelent (egy egyenesen van), itt minkét közelítés 0 eltérést mutat.
Következő
lap: http://gorbem.hu/MT/Izogonalis7.htm