2004-12-19

Baza, linearna ljuska, potprostor, dimenzija,... -- konceptualni pristup

Ana:
Možeš mi malo pojasnit neke pojmove: baza, linearna ljuska i potprostor?


Vektorski prostor je skup vektorâ s nekim operacijama. Preciznije,
imamo dva skupa u igri -
  • skup vektorâ V i
  • skup skalara F ;
četiri operacije:
  • zbrajanje vektorâ, +:VxV->V
  • zbrajanje skalarâ, +:FxF->F
  • množenje skalarâ: *:FxF->F
  • množenje vektora skalarom: *:FxV->V
(npr. ovo zadnje znači da se neki element iz F pomnoži nekim elementom iz V, i dobije se element od V.)
Te operacije zadovoljavaju neke aksiome:
  • F sa zbrajanjem i množenjem skalara je polje
  • V sa zbrajanjem vektora je Abelova grupa
    (za značenje pojmova Abelova grupa i polje vidjeti ovaj post)
  • Vrijedi kvaziasocijativnost, distributivnost prema zbrajanju skalara, i distributivnost prema zbrajanju vektora, operacije množenja vektora skalarom
  • Vrijedi tzv. permanencija jedinice: 1*v=v za svaki vektor v, ako je 1 neutralni element za množenje u F.


To bi bili aksiomi. No kako vektorski prostor pretvoriti u nešto upotrebljivo za računanje?

Well... osnovni račun koji možemo napraviti s (konačnom) hrpom vektorâ zove se linearna kombinacija: odaberemo neke skalare za te vektore, svaki vektor pomnožimo "njegovim" skalarom, i to sve skupa zbrojimo. Mogu se postaviti mnoga pitanja u vezi linearnih kombinacijâ, kao što su:
  • imam vektore v1,...,vn (skraćeno v1..n) i još neki vektor w. Može li se vektor w prikazati kao linearna kombinacija od v1..n? Odnosno, postoje li skalari a1..n takvi da je w=a1v1+...+anvn?

    Skup svih linearnih kombinacijâ vektorâ v1..n zove se njihova
    linearna ljuska, i označava s [{v1..n}]lin. Općenito, ako je S neki skup vektorâ, njegova linearna ljuska (skup svih linearnih kombinacijâ od po konačno mnogo vektorâ iz S) označava se sa [S]lin. Na taj način, pitanje se može zapisati kao: je li w@[{v1..n}]lin ?

  • je li gornji prikaz (preciznije, skalari u njemu) jedinstven? Jednom kad imam v1..n, i znam da mi je neki w element njihove linearne ljuske, može me zanimati može li se on dobiti kao njihova linearna kombinacija na više načinâ, ili samo na jedan. Pokazuje se, jer su vektorski prostori dosta uniformni, da je za dane vektore v1..n dovoljno na to pitanje (jedinstvenost) odgovoriti samo za jedan vektor w - odgovor za jednog jednak je odgovoru za sve ostale koji se mogu prikazati (ako te zanima dokaz ovog, reci). Pa uzmimo specijalno vektor w=0vektor, nulvektor -- neutralni element u grupi vektorâ. To ima dobru stranu što za njega sigurno imamo jedan zapis -- ako uzmem sve skalare 0, lako se pokazuje (0*v=0vektor) da ću dobiti
    0v1+...0vn=0vektor; dakle samo je pitanje postoje li još neki takvi skalari.

  • ako, za dane v1..n, takvi skalari (dakle, koji nisu svi 0,...,0 -- a da linearna kombinacija ipak bude 0vektor) postoje, vektori v1..n zovu se linearno zavisni. Inače, dakle ako je 0vektor (a onda, po gore rečenom, i bilo koji drugi vektor njihove linearne ljuske) moguće zapisati kao linearnu kombinaciju vektorâ v1..n na jedinstven način (u slučaju nulvektora to znači samo pomoću koeficijenata 0,...,0), vektori v1..n zovu se linearno nezavisni.

  • vidjeli smo da, ako su vektori v1..n linearno nezavisni, svaki vektor koji se uopće može prikazati kao njihova linearna kombinacija, može se tako prikazati na jedinstven način. Ako se svaki vektor dade prikazati kao njihova linearna kombinacija (pa onda i na jedinstven način), dakle ako je (uz to što su linearno nezavisni) V=[{v1..n}]lin, tada se (uređeni) skup vektorâ {v1..n} zove baza za vektorski prostor V. Dakle, jednom kad imam fiksiranu bazu v1..n za V, svaki vektor mi je jedinstveno određen pomoću n skalarâ, dakle pomoću neke n-torke (a1..n) elemenata iz F. I za svaki vektor iz V, ta n-torka skalara je jedinstvena.

  • štoviše, n je čak jedinstven (za dani V) neovisno o bazi. Bazâ
    (linearno nezavisnih skupova čija je linearna ljuska cijeli prostor) može biti više (i obično ih ima puno), no pokazuje se da svake dvije baze imaju jednako mnogo elemenata, odnosno taj n je svojstvo samog prostora; i zove se njegova dimenzija. Pišemo n=dimV. Dakle, dimenzija vektorskog prostora je broj elemenata bilo koje njegove baze.

  • još je ostalo razjasniti što ako je skup vektorâ {v1..n} linearno nezavisan, ali njegova linearna ljuska nije nužno cijeli prostor V -- dakle ne moraju se moći svi vektori prikazati kao linearne kombinacije
    od v1..n, ali za one koji se mogu (označimo ih generički slovom w), taj prikaz je jedinstven. Skup svih takvih vektorâ (dakle ovdje [{v1..n}]lin), pokazuje se, zatvoren je na operacije zbrajanja vektorâ i množenja proizvoljnim skalarima (konkretno, zbroj dvije linearne kombinacije s vektorima v1..n opet je linearna kombinacija s vektorima v1..n -- samo zbrojimo odgovarajuće koeficijente. Također, produkt proizvoljne linearne kombinacije vektorâ v1..n s proizvoljnim skalarom, opet je linearna kombinacija istih vektorâ -- samo pomnožimo svaki koeficijent tim skalarom).

  • to znači da, ako skup svih takvih w-ova označimo s W, iako W ne mora biti cijeli prostor V, on također ima "iste" operacije zbrajanja i množenja skalarom kao i V, i svi aksiomi i na njemu vrijede (jer
    aksiomi su obično univerzalne životinje -- ako vrijede "za svaki vektor iz" V, onda vrijede i "za svaki vektor iz" W, jer je svaki vektor iz W ujedno i vektor iz V). Drugim riječima, W je mali vektorski prostor sam za sebe (primijetimo, skup {v1..n} je tada njegova baza), unutar vektorskog prostora V. Kažemo da je W
    potprostor od V. Općenito, potprostor nekog prostora je bilo koji njegov podskup koji je i sâm prostor istog tipa s obzirom na iste (preciznije, restringirane) operacije.

  • vidjeli smo gore da se potprostori mogu dobiti npr. kao linearne ljuske nekih (gore linearno nezavisnih) skupova. To vrijedi i općenito -- ako je W potprostor od V, lako se vidi da je W=[W]lin (sve linearne kombinacije vektorâ iz W ponovo su u W, kad je W zatvoren na zbrajanje vektorâ i množenje skalarima), odnosno bilo koji vektorski potprostor jest linearna ljuska (samog sebe, ako već ničeg drugog). No ta dva pojma imaju drugačije psihološko značenje -- dok je potprostor svojstvo podskupa, koji se gleda kao cjelina, linearna ljuska je prvenstveno ljuska nekog (manjeg, često konačnog) skupa, dakle odaberemo neke vektore i gledamo što je razapeto njima.


al mene sad malo kopka èemu slu¾e ti reci;


A služe, eto... no dobro, ajmo i to malo raspisati.
Dakle, u onom uvodu spomenuta su dva svijeta, jedno polje i jedan vektorski prostor nad njim. U prvom žive tzv. skalari, u drugom žive tzv. vektori. Oni su povezani na razne načine, na primjer vektori se mogu množiti skalarima, i to množenje ima neka svojstva. No povezani su i tješnje. Jednom kad imamo bazu, imamo teorem o koordinatizaciji, koji kaže da svaki vektor možemo predstaviti pomoću n skalara (gdje je n dimenzija prostora), i time uspostaviti vezu između vektorâ kao apstraktnih objekata, i n-torki skalarâ (kao malo manje apstraktnih objekata:).

E sad, pored ova dva, postoji i treći svijet, tzv. dualni prostor. U njemu žive bića koja se zovu "funkcionali" (zapravo punim imenom "linearni funkcionali", no radi kratkoće zapisa zvat ćemo ih samo funkcionalima). Oni se definiraju kao funkcije s vektorskog prostora u pripadno polje, koje poštuju operacije (zbrajanje vektora pretvaraju u zbrajanje skalara, i množenje vektora skalarom pretvaraju u obično množenje dva skalara u polju -- kao linearni operatori, ako shvatimo polje kao vektorski prostor nad samim sobom). I njihov svijet je također vektorski prostor nad istim poljem, i oni se dakle mogu međusobno zbrajati, i množiti skalarima iz tog polja (naravno, znamo kako se dvije npr. realne funkcije zbrajaju, i kako se množe realnim
brojevima). ((Štoviše, mogu se, osim te dvije operacije, i primjenjivati na vektore (i time davati skalare), baš kao što se bilo koja funkcija iz A u B može primjenjivati na elemente od A i time davati elemente od B.))

Dakle, i u dualnom prostoru možemo promatrati linearno nezavisne funkcionale, skupove izvodnica, i naći bazu, tzv. dualnu bazu -- pokazuje se da dualni prostor ima jednaku dimenziju kao i polazni prostor, pa nas to dovodi do ideje da pokušamo uspostaviti neku dobru bijekciju (izomorfizam) između vektorskog prostora i njegovog duala. I
ona zaista postoji... jednom kad fiksiramo bazu u početnom prostoru, na prirodan način se dobiva njoj dualna baza u dualnom prostoru (i-ti funkcional dualne baze definiramo kao i-tu koordinatu vektora zapisanog u početnoj bazi), i tako imamo zajednički jezik za opisivanje i vektorâ i funkcionalâ -- n-torke skalarâ (rekli smo već prije da je dimenzija duala jednaka dimenziji početnog prostora, dakle ovdje n).

((Ovo dalje se uglavnom odnosi na realne prostore... bar terminološki.Konceptualno, mnoge stvari ostaju i u prostorima nad bilo kakvim poljima.))
Postavlja se pitanje, što ako interpretiramo objekt jednog svijeta kao objekt drugog? Na primjer, uzmemo funkcional, zapišemo ga u dualnoj bazi, dobijemo n-torku skalara (njegove koordinate), i onda tih n skalara interpretiramo kao koordinate vektora u primarnom prostoru (složimo linearnu kombinaciju vektorâ početne baze s tim skalarima). Dobit ćemo vektor koji je očito tijesno povezan s funkcionalom od kojeg smo krenuli, bar uz fiksiranu bazu na početku tog procesa. Taj vektor se zove reprezentant tog funkcionala, i imamo čuveni teorem o reprezentaciji, koji kaže da općenito (u konačnodimenzionalnim prostorima, barem) svaki linearni funkcional na taj način može biti reprezentiran određenim vektorom, i obrnuto.

Kakva je to točno veza? Ako uzmem vektor a, i njemu gornjim (obrnutim) postupkom pridružim funkcional a*, kako će on djelovati na proizvoljni vektor b? Očito, pridružit će mu neki skalar. Dakle, efektivno, od dva vektora a i b, ja sam dobio novi skalar a*b. Tako sam dobio operaciju koju zovem skalarno množenje, a skalar a*b, koji se još ponekad označava s (a|b), skalarnim umnoškom a i b. Eto,
dobih novu operaciju, koja sad zadovoljava još neke aksiome, i ako nju uvedem u definiciju prostora zajedno sa zbrajanjem vektorâ i množenjem vektorâ skalarom, dobivam novu, poboljšanu strukturu, koja se zove unitarni (ovdje realni) prostor. No to nam nije trenutni cilj.

Cilj nam je vidjeti kako reprezentirati stvari da bismo njima lakše računali. Vidjeli smo da vektore možemo interpretirati kao n-torke skalara, i da te n-torke ima smisla pisati vertikalno. Analogno tome, funkcionale isto možemo interpretirati kao n-torke skalara, no sad ih treba drugačije zapisati. Pokazuje se da horizontalan zapis ima smisla, i kada se želi prikazati neki potprostor dualnog prostora, on se često prikazuje matricom koja u recima ima koordinate funkcionalâ koji ga razapinju, baš kao što se u primarnom prostoru potprostor prikazuje matricom u čijim su stupcima koordinate vektora koji ga
razapinju.

Ali, ne dovodi li to do toga da je jedna matrica mxn zapravo ambigous,
jer može predstavljati dualni potprostor razapet s m funkcionalâ (njenih m redaka), ili primarni potprostor razapet s n vektorâ (njenih
n stupaca)? Dovodi... ali, kao što mathematičari često kažu, it's not a bug, it's a feature. Drugim riječima, to je namjerno, i vrlo koristan pogled na jednu te istu stvar iz dva različita ugla.

Pogledajmo to na jednom primjeru. (Za ovo nam zapravo treba 2D, no snaći ćemo se valjda nekako). Uzmimo matricu [2 3//1 0//5 7]@R3x2 ("//" je oznaka za novi red). Ta matrica ima tri retka i dva stupca, i može predstavljati i prostor vektorâ razapet vektorima (2,1,5) i (3,0,7) (potprostor od R3), kao i prostor funkcionalâ razapet funkcionalima f, g, h koji odgovaraju vektorima (2,3), (1,0) i (5,7) (potprostor duala od R2). Na primjer, ovaj "srednji" funkcional je ništa drugo nego funkcija "prva koordinata":
eg, g(-3,-9)=-3.

Uzmimo sad neki vektor iz linearne ljuske od {(2,1,5),(3,0,7)} --
dakle neku njihovu linearnu kombinaciju, npr. 8*(2,1,5)-5*(3,0,7)=(1,8,5), i pogledajmo kakve veze gornja tri funkcionala imaju s tim.

Treba nam neki vektor iz R2, na kojem će gornji funkcionali f, g i h djelovati. Uređen par skalara koji se gore prirodno pojavio je (8,-5). Pogledajmo kako gornji funkcionali djeluju na njega:
f(8,-5). f je reprezentiran vektorom (2,3), dakle on množi svoj argument skalarno s (2,3). Iz toga f(8,-5)=((2,3)|(8,-5))=16-15=1.
g(8,-5)=8, jer je g jednostavno "prva koordinata". Naravno, to je ujedno i skalarno množenje s vektorom (1,0).
h(8,-5)=((5,7)|(8,-5))=40-35=5.
Tri funkcionala na jednom vektoru dala su nam tri skalara: 1, 8 i 5.
Poznato? :-)

Dakle, ako ta tri funkcionala gledamo kao jednu cjelinu (kao što se npr. dvije realne funkcije sin i cos mogu gledati kao jedna funkcija u R2, r(x):=(sinx,cosx)), i tu cjelinu nazovemo npr. "linearni
operator";-), slika tog linearnog operatora bit će upravo skup svih uređenih trojki poput ove gornje (1,8,5) -- dakle, onih koje se mogu dobiti kao linearna kombinacija od (2,1,5) i (3,0,7) -- all in all, bit će to upravo potprostor razapet tim vektorima. Gornju matricu od koje smo krenuli, tada zovemo matricom tog linearnog operatora. Ona zaista pruža zgodan način kako zapisati prostor razapet s n vektora, no isto tako i način kako zapisati simultano djelovanje m funkcionalâ.
Ili pak, prostor razapet funkcionalima i ujedno simultano djelovanje neke hrpe vektorâ. %-) ((Kako vektori mogu "djelovati" na funkcionale? Jednako kao i funkcionali na vektore: v(f):=f(v), pomalo neformalno. Formalno, skalarni produkt je, bar u realnim prostorima, komutativan.))

To je bila samo jedna od fascinantnih posljedica unificiranja gornjih svjetova, uvid u koje nam pruža linearna algebra. Puno više o tome, nadam se, čut ćete na LA2.

& jel mogu ja e.g. imat 3vektora u bazi, a da svaki od nijh nema po tri koordinate;


Hm. Primijetite da sam gore uvijek pisao "baza za" (nešto), kao i "skup izvodnica za" nešto. Jednostavno, skup B je baza za prostor X
ako je linearno nezavisan (pri čemu X ne igra neku veliku ulogu, samo priroda operacijâ), i skup izvodnica za X, odnosno svaki vektor iz
X
se može zapisati kao linearna kombinacija vektorâ iz B. Naravno da ovo drugo svojstvo bitno ovisi o tome koliki je X. :-)

Jest, ponekad se ne kaže, i onda se misli na "cijeli (univerzalni) prostor" u kojem se radi. Konkretno ovdje gore, ako imate vektore s četiri (valjda realne) koordinate, radi se o prostoru R4. I ako Vaše pitanje, punom rečenicom, glasi "mogu li imati bazu za R4 od 3 vektora?", odgovor je naravno ne, jer bi to po definiciji dimenzije značilo da je dimR4=3, pa bi ovaj eksponent gore bio stvarno čudno odabran. :-)

Još raspisanije, sama činjenica da imate vektore s 4 koordinate znači da negdje u pozadini imate bazu (vjerojatno kanonsku) za taj vektorski prostor, od 4 elementa (koordinate od x nisu ništa drugo nego koeficijenti u linearnoj kombinaciji, kad se x zapiše na jedinstven način kao linearna kombinacija vektorâ baze). A to bi pak značilo da u jednom te istom prostoru (kako god se on zvao, R4 ili drugačije) imate dvije baze, jednu s 4 a drugu s 3 elementa. Što bi naravno bilo u kontradikciji s teoremom da svake dvije baze imaju jednak broj elemenata.

e.g. jedan vektor iz baze a1 = (1, 2, 3, 4) (ovo je sad napisano tek tak, samo za primjer); al me sad buni ¹to matrica nije kvadratna....


Hm... matrica, kao što smo vidjeli, reprezentira puno toga: potprostor, ali i funkcionale, linearni operator,... Da je kvadratna, to znači jednostavno da se ti funkcionali mogu primjenjivati na početne vektore. Ako nije kvadratna, nečega će biti viška.

Na primjer, da uzmete tu hipotetsku bazu za R4 od 3 elementa, i ta tri vektora (njihove koordinate) posložite u stupce matrice, to bi
bila matrica 4x3. Odnosno, mogla bi reprezentirati simultano djelovanje 4 funkcionala na R3. No to što je ovo gornje baza bi značilo da je prostor razapet njome cijeli R4, pa bismo imali da je slika simultanog djelovanja ta 4 funkcionala (bolje rečeno linearnog operatora s R3 u R4) cijeli R4 (tj. da je taj linearni operator surjekcija), što je nemoguće: linearno preslikati 3D na čitav 4D.

Nema komentara:

Objavi komentar