Lineární nezávislost
Ústředním konceptem lineární algebry je pojem lineární nezávislosti potažmo lineární závislosti vektorů z daného vektorového prostoru. Pomocí tohoto pojmu se definují další velmi důležité objekty lineární algebry, jako je například báze vektorového prostoru. Máme-li soubor několika vektorů, pak lineární závislost je matematicky zachycená intuitivní představa o tom, že lze jeden vektor vyjádřit pomocí ostatních, pokud jsou si tyto vektory dostatečně podobné. Pokud jsou tyto vektory příliš rozdílné, pak nedokážeme sčítáním či prodlužováním vyjádřit jeden vektor pomocí zbylých. Takové vektory jsou lineárně nezávislé.
Motivace
Uvažujme rovinu a v ní mějme šipky ve významu vektorů. Matematicky daná situace odpovídá reálnému vektorovému prostoru , pro vztah tohoto vektorového prostoru a prostoru šipek v rovině viz oddíl Geometrická interpretace v článku lineární kombinace. Vezměme si konkrétní příklad se šipkami vyznačenými na prvním obrázku. Jejich vektorový zápis je
Vidíme, že obě šipky leží na jedné přímce. Navíc vidíme, a je to vidět i z číselného zápisu vektorů výše, že když vektor obrátíme, bude směřovat stejným směrem jako vektor , a když ho ještě prodloužíme na dvojnásobnou délku, tak se bude přesně rovnat tomuto druhému vektoru. Neboli platí
Pokud si v rovnosti výše převedeme oba vektory na jednu stranu, dostáváme výraz
který je speciálním případem tzv. lineární kombinace vektorů. Obecně lze lineární kombinaci dvou vektorů vyjádřit ve tvaru . V našem případě lze tedy výše uvedenou rovnost přepsat jako
Koukněme se nyní na druhý obrázek, kde jsme první vektor pozměnili tak, že jsme mu přepsali jeho druhou složku, máme nyní tedy
Z obrázku teď ale vidíme, že již nelze vektor vyjádřit jako násobek vektoru . Ať tedy vezmeme jakékoli reálné číslo , tak se nám nepodaří splnit rovnost . Zkusme nyní prodlužovat či zkracovat, tj. škálovat, oba vektory, ne jen vektor , a ptejme se, zda by se tyto přeškálované vektory mohly rovnat. Uvažujme tedy výraz
kde jsou čísla, která bychom chtěli najít, aby platila rovnost. Když by bylo číslo nenulové, mohli bychom jím vydělit tuto rovnost a dostat výraz , kde . O tomto výrazu jsme ale už viděli, že nemůže nastat. Vyjadřoval by totiž, že vektor je násobkem vektoru . Co ale, když je číslo rovno nule? V takovém případě obdržíme rovnost , kterou ale můžeme vždy splnit tak, že položíme . Pro nenulový vektor je to navíc jediná volba, jak danou rovnost splnit. Když si nyní přeznačíme naše koeficienty jako a , tak můžeme podobně jako pro první obrázek psát
Vidíme tedy, že když máme dva nenulové vektory mířící různým směrem, tak jejich lineární kombinace, která má být rovná nulovému vektoru, už musí mít nutně oba koeficienty nulové. Lineární kombinaci, která má všechny koeficienty nulové, se říká triviální lineární kombinace. V opačném případě se lineární kombinace nazývá netriviální.
Shrňme si naše dosavadní sledování. Když byl vektor násobkem vektoru (Obr. 1), tak lineární kombinace měla nenulové koeficienty a . Když ale jeden vektor nešel vyjádřit jako násobek toho druhého (Obr. 2), tak jsme obdrželi lineární kombinaci, jejíž koeficienty byly nutně nulové.
První případ by šlo popsat tak, že oba vektory byly závislé v tom smyslu, že z jednoho jsme byli schopni vhodnou úpravou dostat vektor druhý. Ve druhém případě ale už takovou úpravu provést nešlo a vektory byly v tomto smyslu nezávislé. Tato úvaha nás vede na obecnou definici lineární nezávislosti potažmo závislosti, nyní již pro libovolný (nenulový konečný) počet vektorů obecných vektorových prostorů. Místo lineárních kombinací pouze dvou vektorů už tak musíme uvažovat lineární kombinace obecného tvaru
kde jsou prvky tělesa, nad kterým je vektorový prostor definován.
Definice
Buď vektorový prostor nad tělesem a mějme dále soubor vektorů pro jisté přirozené číslo . Uvažujme pak všechny možné lineární kombinace tohoto souboru vektorů, které jsou rovny nulovému vektoru. Pak říkáme, že soubor je lineárně nezávislý, právě když ze všech lineárních kombinací těchto vektorů je rovna nulovému vektoru jen triviální lineární kombinace. V opačném případě nazýváme soubor výše lineárně závislý. Pro lineární nezávislost se občas používá zkratka LN a pro lineární závislost zkratka LZ.[zdroj?]
Výše uvedenou definici lze přeformulovat i takto: Vektory se nazývají lineárně závislé, pokud existuje netriviální lineární kombinace těchto vektorů, jejíž hodnota je nulový vektor. Lze tedy nalézt takové koeficienty pro něž platí, že
- a alespoň jeden z koeficientů .
Pokud taková netriviální lineární kombinace neexistuje, pak jsou vektory označovány jako lineárně nezávislé a jejich lineární kombinace je nulový vektor jedině v triviálním případě, kdy jsou všechna .
Lineární (ne)závislost lze definovat pro libovolné podmnožiny vektorového prostoru, tedy i pro ty s nekonečným počtem prvků. Pak říkáme, že podmnožina vektorového prostoru je lineárně nezávislá množina, právě když každý konečný soubor vektorů z ní vybraný je lineárně nezávislý. Pokud existuje alespoň jeden konečný soubor vektorů, který je lineárně závislý, je daná množina lineárně závislá.
Abychom si ozřejmili výše podanou formální definici lineární nezávislosti souboru vektorů, mějme vektory a uvažujme jejich lineární kombinaci
pro obecné koeficienty , . Položme nyní tuto lineární kombinaci rovnou nulovému vektoru a ptejme se, jaké hodnoty musí mít koeficienty, aby skutečně platila rovnost. To jest
kde máme pevně určeny vektory a hledáme k nim příslušné koeficienty . Pokud po výpočtu výrazu na levé straně zjistíme, že jediné koeficienty, které danou rovnost splňují, musí být všechny rovny nule, tak říkáme, že dané vektory jsou lineárně nezávislé. Pokud alespoň jeden koeficient je nenulový a rovnost výše je splněna, pak tyto vektory nazveme lineárně závislými.
Protože platí, že všechny koeficienty jsou nulové, právě když , a alespoň jeden koeficient je nenulový, právě když , můžeme definici lineární nezávislosti přeformulovat následovně:
Vektory jsou lineárně nezávislé, právě když platí
Vektory jsou lineárně závislé, právě když platí
Vlastnosti
V následujících tvrzeních vždy uvažujeme vektorový prostor nad tělesem .
Alternativní definice
Lineární (ne)závislost se definuje i tak, že soubor vektorů je lineárně závislý, právě když existuje v tomto souboru vektor, který lze vyjádřit jako lineární kombinaci vektorů zbylých. Jinak řečeno, soubor vektorů je lineárně závislý, právě když existuje vektor ležící v lineárním obalu vektorů zbylých. Protože jsme výše zvolili jinou definici, tak si toto tvrzení nyní dokážeme.
- Buď soubor n vektorů, kde . Pak je lineárně závislý, právě když existuje vektor pro jisté tak, že
- kde značí lineární obal.
- Důkaz: Dokažme nejdříve implikaci zleva doprava, tj. mějme lineárně závislý soubor. Existuje tedy netriviální lineární kombinace tohoto souboru dávající nulový vektor, neboli kde je alespoň jeden koeficient nenulový. Označme si ho . Pak můžeme psát
Nyní můžeme sumu výše převést na druhou stranu rovnosti. Protože je nenulový, můžeme jím dělit a dostáváme tak vyjádření pro vektor pomocí zbylých vektorů
Pro důkaz opačné implikace předpokládejme, že lze jistý vektor vyjádřit jako lineární kombinaci zbylých vektorů ve tvaru
Když si vektor ale převedu na pravou stranu rovnosti, tak rázem dostávám netriviální lineární kombinaci původního souboru vektorů, která dává nulový vektor (konkrétně ). Soubor je tak lineárně závislý.
Přímým důsledkem právě dokázané věty je následující tvrzení:
- Buď lineárně závislý soubor n vektorů, kde . Pak existuje tak, že
- Důkaz: Zřejmý z předchozího tvrzení a druhého tvrzení v oddíle Ostatní vlastnosti v článku Lineární obal.
Ostatní
- Množina obsahující jediný vektor je lineárně nezávislá, právě když je tento vektor nenulový, tj.
- Důkaz: Obecná lineární kombinace jednoho vektoru má tvar pro nějaké . Dokažme nejprve sporem implikaci zleva doprava. Máme tedy lineárně nezávislou množinu obsahující jediný vektor a předpokládejme, že je tento vektor nulový. Pak je ale lineární kombinace nulová pro libovolnou hodnotu koeficientu a ne jen v triviálním případě, kdy . Máme tak spor s definicí. Ukažme nyní implikaci zprava doleva. Když je vektor nenulový, pak lineární kombinace bude rovna nulovému vektoru jen pro , což jsme měli dokázat.
- Pokud je soubor vektorů () lineárně nezávislý, tak je lineárně nezávislá i každá jeho podmnožina. Neboli, mějme soubor n vektorů, nechť je nějaké číslo splňující a nechť je l-tice čísel taková, že . Pak, jsou-li lineárně nezávislé, jsou lineárně nezávislé i vektory .
- Důkaz: Je vhodnější dokazovat obměněnou implikaci původního tvrzení, tj. dokažme, že když je soubor lineárně závislý, tak je lineárně závislý i soubor . Předpokládejme, že je lineárně závislý, tj. existuje l-tice koeficientů tak, že
Potom ale dostáváme i netriviální lineární kombinaci původního souboru
když položíme pro a jinak.
- Nechť je lineárně závislý soubor n vektorů. Pak buď , nebo a přitom existuje takové, že
- kde značí lineární obal.
- Důkaz: Z prvního tvrzení této sekce plyne, že pro musí být již nutně , jinak by byl soubor lineárně nezávislý. Máme teď tedy lineární kombinaci s alespoň jedním koeficientem nenulovým. Abychom dokončili důkaz věty, tak musíme ukázat, že alespoň jeden nenulový je nějaký z koeficientů . Pro spor předpokládejme, že . Pak ale
Protože ale , musí být . Jenže to by znamenalo, že jsou úplně všechny koeficienty lineární kombinace nulové, což je spor s tím, že jsme původně volili netriviální lineární kombinaci. Máme tak dokázáno, že mezi koeficienty je alespoň jeden nenulový. Vezměme tedy ten, který má ze všech koeficientů největší index. Označme si ho . Postupem stejným jako v důkaze prvního tvrzení sekce Alternativní definice si vyjádříme vektor pomocí vektorů ostatních. Ty mají všechny menší index než . Dostáváme tak tvrzení věty.
Příklady
Příklad 1 — Aritmetické vektory
Nejčastějšími příklady vektorů jsou n-tice čísel, tzv. aritmetické vektory. Uvažujme pro konkrétnost prostor s klasicky definovanými operacemi sčítání dvou vektorů a násobení vektoru číslem. V tomto prostoru mějme následující tři vektory
Zkoumejme, zda jsou tyto vektory lineárně nezávislé. Uvažujme tedy jejich lineární kombinaci dávající nulový vektor
Využijeme-li definice sčítání vektorů a jejich násobení číslem, tak nám výše uvedená rovnost přejde do tvaru
Třetí řádek rovnosti nám určuje . Dosadíme-li tuto hodnotu to zbylých dvou řádků, zbude nám soustava dvou rovnic pro dvě neznámé
Ta je zjevně splněna jen pro a . Všechny tři koeficienty jsou tedy nulové a my jsme tím dokázali, že vektory jsou lineárně nezávislé.
Příklad 2 — Polynomy
Vektorové prostory mohou být ale rozmanitější, než jen ty s n-ticemi čísel. Vektorovým prostorem je například i množina všech polynomů. Vezměme čtyři jednoduché polynomy a zkoumejme u nich lineární nezávislost:
Jako u aritmetických vektorů uvažujme tedy nejprve jejich obecnou lineární kombinaci, kterou položíme rovnou nulovému vektoru, což je v našem případě nulový polynom. To jest
Shlukneme-li si čísla k jednotlivým mocninám nezávisle proměnné, dostáváme
Máme nyní rovnost, kde na jedné straně vystupuje jistý polynom třetího stupně a na straně druhé je pak nulový polynom, nulová funkce. Tuto rovnost je třeba chápat tak, že musí být splněna pro všechny hodnoty, kterých může nezávisle proměnná nabývat, tj. pro všechna reálná . Dosaďme pár konkrétních hodnot proměnné a snažme se z toho něco zjistit o koeficientech v rovnosti výše. Když položíme postupně , tak se rovnost redukuje do tvaru
Z prvních tří rovnic není těžké odvodit vztahy a . Když tyto dosadíme do rovnice čtvrté, tak obdržíme . Po zpětném dosazení tedy vidíme, že jsou všechny koeficienty nulové a dané polynomy jsou lineárně nezávislé. K tomuto zjištění jsme nemuseli procházet celou reálnou osu, ale stačilo dosadit čtyři konkrétní hodnoty nezávisle proměnné.
Mohli jsme ale vidět rovnou, že jsou dané koeficienty nulové. Na rovnici
se totiž můžeme dívat ve tvaru
Polynom na levé straně rovnosti je roven nulovému polynomu, ten má ale všechny koeficienty u svých mocnin nulové. Dostali bychom tak porovnáním odpovídajících koeficientů rovnou rovnice (levý sloupec v následující tabulce označuje mocninu, u které dané koeficienty v předchozí rovnici vystupují)
Tato soustava rovnic má zřejmě řešení .
Příklad 3 — Komplexní funkce
Vektorový prostor například tvoří i komplexní funkce reálné proměnné, kde definujeme sčítání funkcí a jejich násobení bodově. Máme tedy množinu
Vezměme nyní tři funkce a ptejme se, zda jsou lineárně nezávislé, konkrétně funkce
Symbol i zde značí imaginární jednotku. V matematické analýze se dokazuje tzv. Eulerův vzorec, jenž zní
Když do výše uvedeného vzorce dosadíme místo proměnné proměnnou , tak nám přejde na tvar
kde jsme využili sudosti funkce a lichosti funkce . Sečteme-li výše uvedené vzorce, dostaneme
neboli
Kromě toho, že jsme nalezli jiné vyjádření pro funkci jsme tak ještě navíc ukázali, že jsou funkce lineárně závislé. Funkce jde totiž vyjádřit pomocí zbylých dvou.
Příklad 4 — Závislost na tělese
Bereme-li vektorový prostor jen jako množinu bez vztahu ke svému tělesu, mohou být tytéž vektory lineárně závislé i lineárně nezávislé podle toho, nad jakým tělesem je daný vektorový prostor definován. Pro konkrétnost uvažujme prostor všech uspořádaných dvojic komplexních čísel, tj. . V něm vyberme vektory
Zde symbol i značí imaginární jednotku. Tyto dva vektory jsou lineárně závislé, uvažujeme-li jako vektorový prostor nad tělesem komplexních čísel, ale přitom lineárně nezávislé, uvažujeme-li jako vektorový prostor nad tělesem reálných čísel. V prvním případě, když je těleso komplexní, totiž stačí vynásobit vektor imaginární jednotkou a máme vektor . Když ale uvažujeme těleso reálných čísel, pak podobnou operaci provést nemůžeme, neboť imaginární jednotka není reálné číslo. Zjevně neexistuje jiné reálné číslo, které by po vynásobení převedlo jeden vektor v druhý. Tyto dva vektory jsou tedy nad reálným tělesem lineárně nezávislé. Viz též Příklad 4 v článku Lineární obal.
Odkazy
Literatura
- PYTLÍČEK, Jiří. Lineární algebra a geometrie. Praha: Česká technika - nakladatelství ČVUT, 2008. ISBN 978-80-01-04063-8. – skripta FJFI ČVUT