Vektorový prostor

Vektorový prostor (též lineární prostor, anglicky vector space) je ústředním objektem studia lineární algebry, v jehož rámci jsou definovány všechny ostatní důležité pojmy této disciplíny. V jistém smyslu můžeme vektorový prostor chápat jako zobecnění množiny reálných, potažmo komplexních, čísel. Podobně jako v těchto množinách je i ve vektorovém prostoru definována operace sčítání a násobení s jistými přirozenými omezeními jako asociativita apod. Prvek vektorového prostoru se nazývá vektor (angl. vector). Na vektorovém prostoru je důležité, že má lineární matematickou strukturu, tzn. dva vektory lze sečíst, přičemž tento součet je opět prvkem vektorového prostoru, a totéž platí i pro násobek vektoru. S konceptem vektorového prostoru se lze setkat v nejrůznějších odvětvích matematiky i fyziky. Tvoří základ, v rámci něhož lze elegantně popisovat a řešit jak úlohy numerické matematiky, tak třeba i úlohy chování fyzikálních systémů v klasické či kvantové mechanice.

Historie

Vektorový prostor je poměrně mladý matematický pojem, který vznikl abstrakcí dosud známých matematických objektů jako byly matice, soustavy lineárních rovnic nebo vektory ve fyzice. Podobně jako u samotné lineární algebry lze jeho vznik klást do konce devatenáctého a počátku dvacátého století. Slovo vektor pak pochází z latinského vector znamenající nosič. Oproti skaláru se totiž vyznačuje navíc tím, že "nese" i směr.

První náznak pojmu vektorového prostoru lze najít v díle Die lineale Ausdehnungslehre, ein neuer Zweig der Mathematik od Hermanna Grassmanna z roku 1844[1]. Jeho práce však zůstala téměř nepovšimnuta, protože Grassmann nebyl profesionální matematik a svoji teorii popisoval filozofickým způsobem, který byl pro ostatní matematiky těžko srozumitelný. Přitom to byl on, kdo jako první zavedl pojmy lineární kombinace, lineární nezávislosti, dimenze, lineární obal, báze a další. Navíc též dokázal tvrzení, která nyní známe pod názvy Steinitzova věta o výměně, první věta o dimenzi, nezávislost dimenze na volbě báze, vzorec pro transformaci souřadnic při přechodu mezi dvěma bázemi vektorového prostoru a jiné.

Axiomatickou definici vektorového prostoru pak jako první podává Giuseppe Peano ve svém díle Calcolo geometrico secundo l’Ausdehnungslehre di H. Grassmann, precedutto dalle operazioni della logica deduttiva z roku 1888. Vektorový prostor v dnešní podobě je poprvé definován v dizertační práci Stefana Banacha v roce 1920 a v moderních učebnicích se tento pojem poprvé objevuje v učebnici Modern Algebra od van der Waerdena z roku 1930. Více viz[1] a článek Lineární algebra.

Motivace

Jako motivaci pro zavedení pojmu vektorového prostoru uvažujme dva případy matematických objektů – fyzikální vektory (coby šipky) a polynomy. Pro každý z těchto případů podáme jeho základní charakteristiku a pokusíme se najít vlastnosti, které mají oba tyto případy společné. To nás už přímo povede k definování matematické struktury, splňující jisté vlastnosti, kterou půjde použít jak k popisu fyzikálních vektorů, tak k popisu polynomů. Touto matematickou strukturou bude právě vektorový prostor.

Fyzikální vektory

Obr. 1: Dva vektory alias šipky v rovině s vyznačeným působištěm alias pukem.

Obr. 2: Tytéž vektory jako v předchozím případě, nyní však již označené a usazené do souřadné soustavy.

Obr. 3: Dva vektory výše spolu s jejich výslednicí.

Jako první si představme fyzikální vektory, chápané jako šipky v rovině. Pro názornost mějme puk na ledové ploše a snažme se popsat jeho pohyb po ledě v závislosti na úderech hokejky dopadající na jeho strany s různou intenzitou a v různých směrech. Každý úder hokejky lze popsat velikostí síly, se kterou zasáhla puk, a směrem jejího působení. Úder můžeme tedy přirozeně vyjádřit jako šipku v rovině, jejíž délka odpovídá působící síle a její směr směru působící síly. Zajímá nás nyní, kam se puk posune, bude-li na něj v jeden okamžik působit více než jedna hokejka. V takovém případě se puk posune ve směru výslednice působících sil a jeho posunutí bude úměrné velikosti této výslednice. Výslednici sil přitom obdržíme složením všech "šipek", které v daný okamžik na puk působí. Pro konkrétnost uvažujme, že se nacházíme v situaci popsané obrázkem Obr. 1 vpravo, kde máme dvě působící síly. Abychom mohli s těmito šipkami lépe pracovat, zaveďme si na ledové ploše souřadnicovou soustavu a označme si šipky po řadě symboly $\scriptstyle {\vec {x}}_{1}$ a $\scriptstyle {\vec {x}}_{2}$ , jak je ukázáno na Obr. 2. Výslednice těchto dvou šipek pak vznikne jejich složením, označme si ji $\scriptstyle {\vec {x}}_{3}$ , viz Obr. 3. Složením dvou šipek jsme tedy opět obdrželi nějakou šipku, která nyní popisuje výslednici působících sil popsaných šipkami $\scriptstyle {\vec {x}}_{1}$ a $\scriptstyle {\vec {x}}_{2}$ – výsledek naprosto zjevný, pro další diskuzi však klíčový. Pokud pohlédneme na souřadnice jednotlivých šipek v námi zavedené souřadnicové soustavě, dostáváme

\color {blue}{{\vec {x}}_{1}={\begin{pmatrix}-1\\0,5\end{pmatrix}}}\color {black}{,}\quad \color {red}{{\vec {x}}_{2}={\begin{pmatrix}2\\1\end{pmatrix}}}\color {black}{,}

kde jsou jednotlivé barvy zvoleny tak, aby byl zjevný vztah čísel k obrázkům vpravo. Pod souřadnicemi šipky jsou myšleny souřadnice bodu, ve kterém šipka "končí". Není třeba vypisovat souřadnice bodu, ve kterém šipka "začíná", protože všechny šipky, včetně výslednic a násobků, začínají v tomtéž bodě – puku (který má v naší souřadné soustavě souřadnice $\scriptstyle {\binom {0}{0}}$ ). Pokud se nyní podíváme na souřadnice výslednice sil $\scriptstyle {\vec {x}}_{3}$ , vidíme, že horní složka má hodnotu 1 (x-ová souřadnice) a spodní (y-ová souřadnice) má hodnotu 1,5 (viz Obr. 3, jeden dílek na ose představuje hodnotu 0,5). Pro souřadnice vektorů tedy platí vztah

\color {blue}{\begin{pmatrix}-1\\0,5\end{pmatrix}}\color {black}{+}\color {red}{\begin{pmatrix}2\\1\end{pmatrix}}\color {black}{={\begin{pmatrix}1\\1,5\end{pmatrix}}}.

Pokud výše uvedenou rovnost přepíšeme do kompaktnějšího tvaru, máme $\scriptstyle {\vec {x}}_{1}+{\vec {x}}_{2}={\vec {x}}_{3}$ . Dá se ukázat, že tento vztah platí obecně pro jakoukoli volbu šipek $\scriptstyle {\vec {x}}_{1}$ a $\scriptstyle {\vec {x}}_{2}$ a jejich výslednici $\scriptstyle {\vec {x}}_{3}$ . Vidíme tedy, že výslednici dvou působících sil $\scriptstyle {\vec {x}}_{1}$ a $\scriptstyle {\vec {x}}_{2}$ můžeme vyjádřit jako jejich součet $\scriptstyle {\vec {x}}_{1}+{\vec {x}}_{2}$ .

Dále je zřejmé, že pokud na puk udeříme dvakrát vyšší silou, tak odpovídající šipka bude dvakrát delší, ale zachová si svůj směr. Obecně tedy, mějme nějakou šipku $\scriptstyle {\vec {x}}_{1}$ odpovídající jisté síle. Pak $\scriptstyle \alpha$ -krát vyšší síle bude odpovídat $\scriptstyle \alpha$ -krát delší šipka, která bude mít stejný směr jako $\scriptstyle {\vec {x}}_{1}$ .

Můžeme tedy šipky různě násobit číslem a vzájemně sčítat a opět dostaneme nějakou šipku. Zároveň je vidět, že je jedno jestli složím šipku $\scriptstyle {\vec {x}}_{1}$ se šipkou $\scriptstyle {\vec {x}}_{2}$ , nebo naopak. Neboli

{\vec {x}}_{1}+{\vec {x}}_{2}={\vec {x}}_{2}+{\vec {x}}_{1}.

Této vlastnosti se říká komutativita. Mějme nyní tři šipky $\scriptstyle {\vec {x}}_{1},{\vec {x}}_{2},{\vec {x}}_{3}$ . Podobně jako v předchozím případě je jedno, jestli nejdříve složím šipku $\scriptstyle {\vec {x}}_{1}$ se šipkou $\scriptstyle {\vec {x}}_{2}$ a jejich výslednici složím se šipkou $\scriptstyle {\vec {x}}_{3}$ , nebo jestli nejdříve složím šipku $\scriptstyle {\vec {x}}_{2}$ se šipkou $\scriptstyle {\vec {x}}_{3}$ a jejich výslednici se šipkou $\scriptstyle {\vec {x}}_{1}$ . Neboli

({\vec {x}}_{1}+{\vec {x}}_{2})+{\vec {x}}_{3}={\vec {x}}_{1}+({\vec {x}}_{2}+{\vec {x}}_{3}).

Této vlastnosti se říká asociativita. Je také vidět, že pokud k jakémukoli vektoru $\scriptstyle {\vec {x}}_{1}$ přičtu vektor

{\vec {0}}={\begin{pmatrix}0\\0\end{pmatrix}},

tak dostanu opět vektor $\scriptstyle {\vec {x}}_{1}$ . Vektoru $\scriptstyle {\vec {0}}$ odpovídá "šipka" nulové délky a říká se mu nulový vektor. A konečně také vidíme, že když přesně proti sobě na puk působí dvě síly $\scriptstyle {\vec {x}}$ a $\scriptstyle {\vec {y}}$ stejné velikosti, tak se jejich účinek vyruší, tj. puk stojí na místě. Neboli jejich výslednice, tj. součet, je nulový vektor. Tedy $\scriptstyle {\vec {x}}+{\vec {y}}={\vec {0}}$ , neboli $\scriptstyle {\vec {y}}=-{\vec {x}}$ . Máme-li nějaký vektor $\scriptstyle {\vec {x}}$ , tak k němu vždy, jak vidíme, existuje jistý vektor $\scriptstyle -{\vec {x}}$ takový, že jejich výslednice je nulový vektor. Vektoru $\scriptstyle -{\vec {x}}$ říkáme vektor opačný k vektoru $\scriptstyle {\vec {x}}$ .

Shrňme si nyní, na co jsme zatím přišli:

Šipky lze sčítat a násobit číslem. Součet dvou šipek je opět šipka. Podobně násobek šipky je opět šipka.
Sčítání šipek je komutativní.
Sčítání šipek je asociativní.
"Šipku nulové délky", nulový vektor, můžu přičíst k libovolné jiné šipce, aniž bych tuto změnil.
Ke každé šipce najdu šipku k ní opačnou, opačný vektor.

Podobnou diskuzi vztahu šipek a "fyzikálních" vektorů lze nalézt v oddíle Geometrická interpretace v článku lineární kombinace.

Polynomy jako vektory

Když jsme nyní vypsali základní vlastnosti množiny šipek spolu s jejich sčítáním a násobením číslem, přesuňme svoji pozornost na polynomy. Neboli na funkce $\scriptstyle p$ tvaru

p(x)=a_{n}x^{n}+a_{n-1}x^{n-1}+\ldots +a_{1}x+a_{0}

.

Když sečteme dva polynomy $\scriptstyle p$ a $\scriptstyle q$ , tak dostaneme funkci

p(x)+q(x)=(a_{n}x^{n}+a_{n-1}x^{n-1}+\ldots +a_{1}x+a_{0})+(b_{n}x^{n}+b_{n-1}x^{n-1}+\ldots +b_{1}x+b_{0})=(a_{n}+b_{n})x^{n}+(a_{n-1}+b_{n-1})x^{n-1}+\ldots +(a_{1}+b_{1})x+(a_{0}+b_{0}),

což je ale opět polynom, jehož koeficienty jsou nyní rovny součtům koeficientů polynomu $\scriptstyle p$ a polynomu $\scriptstyle q$ . Tyto koeficienty jsou zjevně stejné bez ohledu na pořadí sčítání $\scriptstyle p$ a $\scriptstyle q$ , neboli

p+q=q+p.

Platí tedy komutativita. Snadno by se ověřila i asociativita sčítání. Též je vidět, že funkce $\scriptstyle \alpha p$ vzniklá vynásobením polynomu $\scriptstyle p$ číslem $\scriptstyle \alpha$ je opět polynom, který má nyní koeficienty rovné $\scriptstyle \alpha a_{i}$ , kde $\scriptstyle a_{i}$ jsou koeficienty polynomu $\scriptstyle p$ . Dále je patrné, že nulová funkce, která každému bodu přiřazuje nulu, je polynom (jehož všechny koeficienty jsou nulové). Říkáme mu nulový polynom. Když k nulovému polynomu přičteme libovolný polynom, tak součet bude roven přičítanému polynomu. Konečně, mějme nějaký polynom $\scriptstyle p$ . Když ho vynásobíme číslem -1, tak dostaneme polynom $\scriptstyle -p$ , kterému říkáme opačný polynom. Platí, že

(-p)+p=0.

Součet polynomu a k němu opačného polynomu tedy dává nulový polynom. Opět si shrňme dosavadní zjištění:

Součet dvou polynomů je opět polynom. Podobně násobek polynomu číslem je opět polynom.
Sčítání polynomů je komutativní.
Sčítání polynomů je asociativní.
Když k nulovému polynomu přičtu libovolný polynom, tak bude součet roven přičítanému polynomu.
Ke každému polynomu najdu polynom k němu opačný.

Společné vlastnosti

Seznam vlastností šipek i seznam vlastností polynomů výše byly záměrně napsány v co nejshodnější podobě. Jak vidíme, i přes zjevnou rozdílnost mají šipky i polynomy mnoho vlastností totožných. Jde například o komutativitu či asociativitu sčítání nebo o existenci nulového prvku. Podobnosti mezi vlastnostmi různých matematických objektů, jako v případě těch dvou výše zmíněných, vedly matematiky k zavedení matematické struktury, která je určena právě těmito vlastnosti. Jedná se o množinu, kdy není specifikován konkrétní tvar jejích prvků, ale zajímají nás především jejich vzájemné vztahy. Nezáleží tedy moc na tom, zda uvažujeme šipky či polynomy, ale velkou roli hraje např. to, že oboje lze sčítat a nezáleží na pořadí sčítání.

Mějme nyní tedy množinu, kterou si označme $\scriptstyle V$ a jejíž prvky budeme značit v analogii se šipkami jako $\scriptstyle {\vec {x}},{\vec {y}},{\vec {z}},\ldots$ , aniž bychom nějak blíže věděli, co tyto prvky jsou. Nezajímá nás tedy, zda je $\scriptstyle {\vec {x}}$ šipka či polynom. Po těchto prvcích však požadujeme, aby splňovaly následující vlastnosti:

Součet dvou prvků je opět prvek $\scriptstyle V$ . Podobně násobek prvku číslem leží opět ve $\scriptstyle V$ . Jinými slovy, množina $\scriptstyle V$ je uzavřená na operace sčítání a násobení číslem.
Sčítání prvků je komutativní.
Sčítání prvků je asociativní.
Když k nulovému prvku přičtu libovolný prvek, tak bude součet roven přičítanému prvku.
Ke každému prvku najdu prvek k němu opačný.

Dosud jsme uvažovali prvky z $\scriptstyle V$ násobené číslem. Pojem čísla je ale pro matematiku příliš konkrétní a tak lze místo množiny čísel uvažovat obecnější množinu, tzv. těleso. Těleso samotné má pak také dodatečnou strukturu určenou požadavky, které se podobají těm, které klademe na prvky množiny $\scriptstyle V$ . Označme si těleso písmenem $\scriptstyle T$ . Konkrétně od něho požadujeme, aby pro libovolné dva prvky $\scriptstyle \alpha ,\beta$ tělesa $\scriptstyle T$ platilo:

Součet $\scriptstyle \alpha +\beta$ je také prvek $\scriptstyle T$ .
Násobek $\scriptstyle \alpha \cdot \beta$ je také prvek $\scriptstyle T$ .
Prvek opačný k $\scriptstyle \alpha$ , tj. $\scriptstyle -\alpha$ je také prvek $\scriptstyle T$ .
Pro každý nenulový prvek $\scriptstyle \alpha$ je $\scriptstyle {\frac {1}{\alpha }}$ také prvek $\scriptstyle T$ .

Těleso je tedy množina vybavená operací sčítání a operací násobení. První dva požadavky výše vyjadřují, že je těleso pro tyto dvě operace uzavřené. Můžeme v něm navíc najít jak neutrální prvek vůči operaci sčítání, který označujeme 0, tak i neutrální prvek vůči operaci násobení, který označujeme 1. Výraz $\scriptstyle {\frac {1}{\alpha }}$ ve čtvrtém bodě výše pak vyjadřuje inverzní prvek pro $\scriptstyle \alpha$ vůči operaci násobení.

Dospěli jsme tak zatím k matematické struktuře sestávající z množiny $\scriptstyle V$ , ke které je přidruženo těleso $\scriptstyle T$ , přičemž součet prvků z $\scriptstyle V$ a jejich násobek prvkem z $\scriptstyle T$ leží opět ve $\scriptstyle V$ a přitom jsou splněny jisté dodatečné podmínky. Když matematicky precizně přeformulujeme právě uvedené požadavky, dodáme pár požadavků dalších a celou věc trochu zobecníme, tak dospíváme k současné definici vektorového prostoru jak je podána v následujícím oddíle.

Definice

Nechť jsou dány

neprázdná množina $\scriptstyle V$ , jejíž prvky nazýváme vektory,
těleso $\scriptstyle T$ (s operacemi sčítání + a násobení $\scriptstyle \cdot$ ),
zobrazení ${\displaystyle \scriptstyle \oplus$ , jež nazýváme sčítání vektorů,
zobrazení ${\displaystyle \scriptstyle \odot$ , jež nazýváme násobení vektoru (prvkem z tělesa; skalárem).

Řekneme, že $\scriptstyle V$ je vektorový prostor nad tělesem $\scriptstyle T$ s vektorovými operacemi $\scriptstyle \oplus ,\odot$ , právě když je množina $\scriptstyle V$ uzavřená na operace $\scriptstyle \oplus$ a $\scriptstyle \odot$ a současně platí tzv. axiomy vektorového prostoru. Těchto axiomů je osm a jejich znění je následující:

Axiomy vektorového prostoru
Č.	Slovně	Symbolicky
1	komutativita pro sčítání vektorů	$(\forall {\vec {x}}\in V)(\forall {\vec {y}}\in V)({\vec {x}}\oplus {\vec {y}}={\vec {y}}\oplus {\vec {x}})$
2	asociativita pro sčítání vektorů	$(\forall {\vec {x}}\in V)(\forall {\vec {y}}\in V)(\forall {\vec {z}}\in V)(({\vec {x}}\oplus {\vec {y}})\oplus {\vec {z}}={\vec {x}}\oplus ({\vec {y}}\oplus {\vec {z}}))$
3	existence nulového vektoru	$(\exists {\vec {0}}\in V)(\forall {\vec {x}}\in V)({\vec {x}}\oplus {\vec {0}}={\vec {x}})$
4	existence opačného vektoru	$(\forall {\vec {x}}\in V)(\exists {\vec {y}}\in V)({\vec {x}}\oplus {\vec {y}}={\vec {0}})$
5	asociativita pro násobení vektoru	$(\forall \alpha \in T)(\forall \beta \in T)(\forall {\vec {x}}\in V)(\alpha \odot (\beta \odot {\vec {x}})=(\alpha \cdot \beta )\odot {\vec {x}})$
6	invariance vektoru při vynásobení jednotkovým prvkem tělesa	$(\forall {\vec {x}}\in V)(1\odot {\vec {x}}={\vec {x}})$
7	distributivita násobení vektoru vzhledem ke sčítání prvků tělesa	$(\forall \alpha \in T)(\forall \beta \in T)(\forall {\vec {x}}\in V)((\alpha +\beta )\odot {\vec {x}}=(\alpha \odot {\vec {x}})\oplus (\beta \odot {\vec {x}}))$
8	distributivita násobení vektoru vzhledem ke sčítání vektorů	$(\forall \alpha \in T)(\forall {\vec {x}}\in V)(\forall {\vec {y}}\in V)(\alpha \odot ({\vec {x}}\oplus {\vec {y}})=(\alpha \odot {\vec {x}})\oplus (\alpha \odot {\vec {y}}))$

Axiomy 1 až 4 vyjadřují, že množina $\scriptstyle V$ tvoří vzhledem ke sčítání vektorů komutativní grupu, kde nulový vektor představuje neutrální prvek grupy a opačný vektor představuje inverzní prvek k danému prvku grupy alias vektoru. Z definice operací $\scriptstyle \oplus$ a $\scriptstyle \odot$ implicitně vyplývá, že uvažujeme pouze ty operace sčítání vektorů a násobení vektoru prvkem z tělesa, pro něž je množina $\scriptstyle V$ uzavřená. Běžně se místo znaku $\scriptstyle \oplus$ pro sčítání používá znaménko + a místo znaku $\scriptstyle \odot$ pro násobení se užívá znaménka $\scriptstyle \cdot$ . Zde byly tyto symboly použity, aby se odlišilo sčítání dvou vektorů a sčítání dvou prvků tělesa, resp. násobení vektoru prvkem tělesa a násobení dvou prvků tělesa. Z kontextu je ale vždy patrné, kterou operaci je nutno použít.

Zdaleka nejčastěji se uvažují číselná tělesa reálných či komplexních čísel. Vektorový prostor nad tělesem reálných čísel $\scriptstyle \mathbb {R}$ se nazývá reálný vektorový prostor, vektorový prostor nad tělesem komplexních čísel $\scriptstyle \mathbb {C}$ se pak jmenuje komplexní vektorový prostor. Vektorový prostor obsahující pouze nulový vektor se označuje jako nulový (nebo triviální) vektorový prostor. Triviální prostor je nejjednodušším příkladem vektorového prostoru. Dokonce z definice tělesa vyplývá, že i těleso samotné je spolu s operací sčítání a násobení prvkem z tělesa vektorovým prostorem samo nad sebou.

Pro značení vektorů se používají různé notace, nejčastěji se lze setkat buď s polotučným sázením symbolů pro vektory jako x, y, z, anebo se symboly vysázenými italikou majícími nad sebou šipku jako $\scriptstyle {\vec {x}},{\vec {y}},{\vec {z}}$ . Zde se budeme držet druhé jmenované konvence. Přísně vzato je z definice vektorový prostor uspořádaná čtveřice $\scriptstyle (V,T,\oplus ,\odot )$ , obvykle se ale takový vektorový prostor značí prostě jako $\scriptstyle V$ a buď se předpokládá, že čtenář ví, které těleso a operace jsou použity, nebo jsou tyto specifikovány vždy při definici množiny $\scriptstyle V$ . V případě běžně používaných vektorových prostorů jako např. $\scriptstyle \mathbb {R} ^{n}$ jsou příslušné operace a dané těleso definovány v podstatě kanonicky a nemůže dojít k nejasnostem.

Stejně jako u každé jiné množiny, můžeme i v případě vektorového prostoru uvažovat jeho podmnožiny. Máme na mysli konkrétně podmnožiny množiny $\scriptstyle V$ , kde $\scriptstyle (V,T,\oplus ,\odot )$ je daný vektorový prostor. Výsadní postavení mezi všemi podmnožinami mají pak ty z nich, které jsou sami o sobě vektorovými prostory. Tyto podmnožiny nazýváme podprostory daného vektorového prostoru. Více viz článek Vektorový podprostor.

Obecné vlastnosti

V následujícím uvažujeme vektorový prostor $\scriptstyle V$ nad tělesem $\scriptstyle T$ . Z definice vektorového prostoru lze dokázat například tyto vlastnosti:

Nulový vektor $\scriptstyle {\vec {0}}\in V$ je právě jeden, tj.

{\displaystyle (\exists

Důkaz: Z axiómů máme zajištěnu existenci přinejmenším jednoho nulového vektoru. Předpokládejme, že jich je víc a uvažujme dva nějaké nulové vektory

\scriptstyle {\vec {0}}_{1},{\vec {0}}_{2}

, kdy

\scriptstyle {\vec {0}}_{1}\neq {\vec {0}}_{2}

. Pak platí

\scriptstyle {\vec {0}}_{1}={\vec {0}}_{1}+{\vec {0}}_{2}={\vec {0}}_{2}+{\vec {0}}_{1}={\vec {0}}_{2}

, kde jsme po řadě využili axiomů 3, 1 a opět 3. Vidíme tedy, že

\scriptstyle {\vec {0}}_{1}={\vec {0}}_{2}

, což je spor.

Ke každému vektoru $\scriptstyle {\vec {x}}\in V$ existuje právě jeden vektor opačný. Tento se obvykle značí $\scriptstyle -{\vec {x}}$ . V matematickém zápise

{\displaystyle (\forall {\vec {x}}\in V)(\exists

Důkaz: Opět máme z axiomů zajištěnu existenci alespoň jednoho opačného vektoru k danému vektoru

\scriptstyle {\vec {x}}

. Předpokládejme existenci alespoň dvou opačných navzájem různých vektorů

\scriptstyle {\vec {y}}_{1},{\vec {y}}_{2}

. Pak platí

\scriptstyle {\vec {y}}_{1}={\vec {y}}_{1}+{\vec {0}}={\vec {y}}_{1}+({\vec {x}}+{\vec {y}}_{2})=({\vec {y}}_{1}+{\vec {x}})+{\vec {y}}_{2}={\vec {0}}+{\vec {y}}_{2}={\vec {y}}_{2}

, kde jsme použili 3., 4., 2. ,1. a opět 4., 1. a 3. axiomu. Máme tedy

\scriptstyle {\vec {y}}_{1}={\vec {y}}_{2}

, což je spor.

Pro každé dva vektory $\scriptstyle {\vec {a}},{\vec {b}}\in V$ má rovnice $\scriptstyle {\vec {a}}={\vec {b}}+{\vec {x}}$ právě jedno řešení $\scriptstyle {\vec {x}}=-{\vec {b}}+{\vec {a}}$ , tj.

(\forall {\vec {a}}\in V)(\forall {\vec {b}}\in V)(\forall {\vec {x}}\in V)({\vec {a}}={\vec {b}}+{\vec {x}}\quad \Rightarrow \quad {\vec {x}}=-{\vec {b}}+{\vec {a}})

Důkaz: Daný předpis pro

\scriptstyle {\vec {x}}

vypsaný výše zřejmě řeší danou rovnici, stačí dosadit a použít po řadě 2., 4., 1. a 3. axiom. Dokažme jednoznačnost řešení. Pro spor předpokládejme, že existují dvě řešení

\scriptstyle {\vec {x}}_{1},{\vec {x}}_{2}

,

\scriptstyle {\vec {x}}_{1}\neq {\vec {x}}_{2}

,

\scriptstyle {\vec {a}}={\vec {b}}+{\vec {x}}_{1}={\vec {b}}+{\vec {x}}_{2}

. K poslední rovnosti můžeme zleva přičíst opačný vektor k

\scriptstyle {\vec {b}}

, tj. dostaneme

\scriptstyle (-{\vec {b}})+({\vec {b}}+{\vec {x}}_{1})=(-{\vec {b}})+({\vec {b}}+{\vec {x}}_{2})

, což je však podle 2., 1. a 4. axiomu ekvivalentní výrazu

\scriptstyle {\vec {x}}_{1}={\vec {x}}_{2}

. Dospěli jsme tedy ke sporu.

Libovolný násobek nulového vektoru je nulový vektor. Podobně, nulový násobek libovolného vektoru je nulový vektor. Neboli (0 je neutrální prvek pro sčítání v $\scriptstyle T$ )

(\forall \alpha \in T)(\alpha \cdot {\vec {0}}={\vec {0}})

(\forall {\vec {x}}\in V)(0\cdot {\vec {x}}={\vec {0}})

Důkaz: Uvažujme nejprve

\scriptstyle \alpha \neq 0

a dokazujme první vlastnost. Mějme libovolný vektor

\scriptstyle {\vec {x}}

a výraz

\scriptstyle {\vec {x}}+\alpha {\vec {0}}=\alpha ({\frac {1}{\alpha }}{\vec {x}}+{\vec {0}})=\alpha ({\frac {1}{\alpha }}{\vec {x}})=1{\vec {x}}={\vec {x}}

. Vektor

\scriptstyle \alpha {\vec {0}}

se tedy сhová jako nulový vektor a z již dokázané jednoznačnosti nulového vektoru musí platit

\scriptstyle \alpha {\vec {0}}={\vec {0}}

. Případ pro

\scriptstyle \alpha =0

je podpřípadem druhé vlastnosti, kterou nyní dokážeme. Mějme rovnici

\scriptstyle \alpha {\vec {x}}+{\vec {y}}=\alpha {\vec {x}}

, kde je naší neznámou vektor

\scriptstyle {\vec {y}}

. Vidíme, že rovnici vyhovuje volba

\scriptstyle {\vec {y}}={\vec {0}}

. Když ale dosadíme

\scriptstyle {\vec {y}}=0{\vec {x}}

, tak máme

\scriptstyle \alpha {\vec {x}}+0{\vec {x}}=\alpha {\vec {x}}

, tj.

\scriptstyle (\alpha +0){\vec {x}}=\alpha {\vec {x}}

. Přitom levá strana je rovna straně pravé. Rovnost je tedy splněna i pro

\scriptstyle {\vec {y}}=0{\vec {x}}

a z jednoznačnosti řešení dokázané výše musí nutně

\scriptstyle {\vec {0}}=0{\vec {x}}

.

Vlastnost:

(\forall \alpha \in T)(\forall {\vec {x}}\in V)(\alpha \cdot {\vec {x}}={\vec {0}}\quad \Leftrightarrow \quad \alpha =0\lor {\vec {x}}=0)

Důkaz: Implikace zprava doleva plyne z předchozího tvrzení. Implikaci zleva doprava dokažme sporem. Předpokládejme tedy, že

\scriptstyle \alpha {\vec {x}}={\vec {0}}

a přitom

\scriptstyle \alpha \neq 0

a současně

\scriptstyle {\vec {x}}\neq {\vec {0}}

. Obě strany rovnice můžu tedy vynásobit prvkem

\scriptstyle {\frac {1}{\alpha }}

dostávajíc

\scriptstyle {\vec {x}}={\frac {1}{\alpha }}{\vec {0}}

. Pravá strana rovnosti je ale podle předchozího tvrzení rovna nule a tedy

\scriptstyle {\vec {x}}={\vec {0}}

, což je spor.

Vlastnost:

(\forall \alpha \in T)(\forall {\vec {x}}\in V)((-\alpha )\cdot {\vec {x}}=-(\alpha \cdot {\vec {x}})=\alpha \cdot (-{\vec {x}}))

Důkaz: Uvažujme rovnici

\scriptstyle \alpha {\vec {x}}+{\vec {y}}={\vec {0}}

, jejíž řešení je zjevně

\scriptstyle {\vec {y}}=-(\alpha {\vec {x}})

. Současně ale

\scriptstyle \alpha {\vec {x}}+(-\alpha ){\vec {x}}=(\alpha +(-\alpha )){\vec {x}}=0{\vec {x}}={\vec {0}}

a

\scriptstyle (-\alpha ){\vec {x}}

je tedy též řešením. Navíc

\scriptstyle \alpha {\vec {x}}+\alpha (-{\vec {x}})=\alpha ({\vec {x}}+(-{\vec {x}}))=\alpha {\vec {0}}={\vec {0}}

a

\scriptstyle \alpha (-{\vec {x}})

je tedy též řešením. Z již výše dokázané jednoznačnosti řešení rovnice tedy plyne

\scriptstyle -(\alpha {\vec {x}})=(-\alpha ){\vec {x}}=\alpha (-{\vec {x}})

.

Opačný vektor k danému vektoru lze získat tak, že ho vynásobíme prvkem z tělesa, který je opačný k jednotkovému prvku. Neboli

(\forall {\vec {x}}\in V)((-{\vec {x}})=-1\cdot {\vec {x}})

Důkaz: Plyne z předchozího tvrzení položením

\scriptstyle \alpha =1

.

Vektorové operace s množinami

Kromě aritmetických operací definovaných nad samotnými vektory a prvky tělesa můžeme též uvažovat obdobné operace nad celými množinami vektorů potažmo prvků tělesa. Zavedení těchto operací umožňuje mimo jiné kompaktnější zápis některých vztahů mezi množinami vektorů a dává tak vyniknout jejich vzájemným souvislostem.

Mějme vektorový prostor $\scriptstyle V$ nad tělesem $\scriptstyle T$ . Dále uvažujme dvě neprázdné podmnožiny $\scriptstyle A$ a $\scriptstyle B$ vektorového prostoru $\scriptstyle V$ . Pro tyto můžeme definovat jejich součet následujícím způsobem:

A+B\equiv \{{\vec {x}}\in V|(\exists {\vec {a}}\in A)(\exists {\vec {b}}\in B)({\vec {x}}={\vec {a}}+{\vec {b}})\}=\{{\vec {a}}+{\vec {b}}|{\vec {a}}\in A,{\vec {b}}\in B\}.

Součet dvou podmnožin vektorového prostoru nazýváme direktní součet, právě když lze každý vektor $\scriptstyle {\vec {x}}$ z množiny $\scriptstyle A+B$ vyjádřit ve tvaru $\scriptstyle {\vec {x}}={\vec {a}}+{\vec {b}}$ právě jedním způsobem, kde $\scriptstyle {\vec {a}}\in A$ a $\scriptstyle {\vec {b}}\in B$ . Direktní součet množin $\scriptstyle A$ a $\scriptstyle B$ značíme $\scriptstyle A\oplus B$ . Neboli

{\displaystyle A\oplus B\equiv \{{\vec {x}}\in V|(\exists

Uvažujeme-li ještě neprázdnou podmnožinu $\scriptstyle S$ tělesa $\scriptstyle T$ , tak jako násobek množiny $\scriptstyle S$ a $\scriptstyle A$ označujeme množinu

S\cdot A\equiv \{{\vec {x}}\in V|(\exists \alpha \in S)(\exists {\vec {a}}\in A)({\vec {x}}=\alpha {\vec {a}})\}=\{\alpha {\vec {a}}|\alpha \in S,{\vec {a}}\in A\}.

Běžně se pro zjednodušení zápisu používají následující konvence ( $\scriptstyle {\vec {a}}\in V$ ):

$\scriptstyle \{-1\}\cdot A\equiv -A,$
$\scriptstyle \{{\vec {a}}\}+A\equiv {\vec {a}}+A,$
$\scriptstyle A+(-B)\equiv A-B,$
$\scriptstyle \{\alpha \}\cdot A\equiv \alpha A.$

Pro operace sčítání a násobení nad podmnožinami vektorového prostoru, resp. tělesa, lze snadno odvodit následující vlastnosti ( $\scriptstyle S_{1},S_{2}\subset T$ ):

operace sčítání množin je komutativní a asociativní,
$\scriptstyle A+{\vec {0}}=A,$
$\scriptstyle \{1\}\cdot A=A,$
$\scriptstyle S_{1}\cdot (S_{2}\cdot A)=(S_{1}\cdot S_{2})\cdot A,$
$\scriptstyle S\cdot (A+B)\subset S\cdot A+S\cdot B,$
$\scriptstyle (S_{1}+S_{2})\cdot A\subset S_{1}\cdot A+S_{2}\cdot A,$
platí zřejmě $\scriptstyle {\vec {0}}\in A-A$ , ale obecně rozhodně neplatí, že by rozdíl $\scriptstyle A-A$ byla množina obsahující jen nulový vektor; pokud je $\scriptstyle A$ vektorový podprostor prostoru $\scriptstyle V$ , tak dokonce platí rovnost $\scriptstyle A-A=A$ .

Tam, kde je výše místo rovnosti vyznačená jen inkluze, obecně rovnost neplatí. Ukažme si vzhledem k inkluzi ještě jedno další tvrzení, jehož důkaz je triviální:

Buď $\scriptstyle V$ vektorový prostor nad tělesem $\scriptstyle T$ a $\scriptstyle A_{1},B_{1}$ , $\scriptstyle A,B$ jeho neprázdné podmnožiny splňující vztah $\scriptstyle A_{1}\subset A$ a $\scriptstyle B_{1}\subset B$ . Buďte dále $\scriptstyle S_{1},S$ neprázdné podmnožiny tělesa $\scriptstyle T$ splňující $\scriptstyle S_{1}\subset S$ . Pak platí

S_{1}\cdot A_{1}\subset S\cdot A\quad \mathrm {a} \quad A_{1}+B_{1}\subset A+B.

V souvislosti s direktním součtem dvou vektorových podprostorů $\scriptstyle A,B$ je velmi užitečné si uvézt následující tvrzení:

Součet $\scriptstyle A+B$ je direktním součtem, tj. $\scriptstyle A\oplus B$ , právě když v průniku podprostorů $\scriptstyle A$ a $\scriptstyle B$ leží právě jen nulový vektor. To jest

A+B=A\oplus B\quad \Leftrightarrow \quad A\cap B=\{{\vec {0}}\}.

Pro důkaz viz oddíl Rovnosti a inkluze v článku Vektorový podprostor.

Základní pojmy

Uveďme si nejprve několik pojmů, které se úzce vážou k vektorům a jejich množinám. Tyto pojmy nám pak pomohou lépe pochopit strukturu vektorového prostoru a umožní i snazší zacházení s vektory.

Lineární kombinace

Nejzákladnější věc, kterou můžeme s vektory udělat, je sečíst je nebo je vynásobit prvkem z tělesa. Když budeme mít $\scriptstyle k$ vektorů $\scriptstyle {\vec {x}}_{1},{\vec {x}}_{2},\ldots ,{\vec {x}}_{k}$ , z nichž každý vynásobíme prvkem z tělesa (prvky $\scriptstyle \alpha _{1},\alpha _{2},\ldots ,\alpha _{k}$ ) a nakonec je všechny sečteme, tak dostaneme vektor

\alpha _{1}{\vec {x}}_{1}+\alpha _{2}{\vec {x}}_{2}+\ldots +\alpha _{k}{\vec {x}}_{k}=\sum _{i=1}^{k}\alpha _{i}{\vec {x}}_{i}.

Tento vektor nazýváme lineární kombinace vektorů $\scriptstyle {\vec {x}}_{1},{\vec {x}}_{2},\ldots ,{\vec {x}}_{k}$ .

Lineární nezávislost

Pojem lineární nezávislosti zachycuje intuitivní fakt, že některé vektory si jsou podobnější než jiné. Máme-li například dvě šipky stejného směru, ale různé délky, pak dokážeme jednu šipku vyjádřit jako násobek druhé šipky. Šipky jsou tedy v jistém smyslu na sobě závislé. Budeme-li ale mít dvě šipky různých směrů, pak jednu nedokážeme vhodným násobkem převést na šipku druhou. Obě šipky jsou tedy na sobě nezávislé. Obecněji, pokud máme $\scriptstyle k$ šipek a přitom $\scriptstyle k$ -tou šipku jsme schopni vyjádřit jako lineární kombinaci předchozích $\scriptstyle k-1$ šipek, pak říkáme, že jsou tyto šipky alias vektory lineárně závislé. Pokud nejsme schopni žádnou ze šipek vyjádřit jako lineární kombinaci šipek ostatních, pak říkáme, že jsou tyto šipky lineárně nezávislé.

Dimenze

Vraťme se na chvíli k oddílu Motivace výše na případ šipek v rovině a na polynomy. Abychom mohli šipky vhodně popisovat, zavedli jsme si v rovině souřadnicovou soustavu. Každé šipce jsme tedy schopni jednoznačně přiřadit dvojici čísel – její $\scriptstyle x$ -ovou a $\scriptstyle y$ -ovou souřadnici v dané souřadnicové soustavě. Vidíme tedy, že nám k plnému určení šipky v rovině stačí dvě čísla. Zkoumejme nyní případ polynomů. Označme si množinu všech polynomů jako $\scriptstyle P$ . Víme, že obecný tvar polynomu vypadá následovně

p(x)=a_{n}x^{n}+a_{n-1}x^{n-1}+\ldots +a_{1}x+a_{0}

,

kde $\scriptstyle n$ je nějaké přirozené číslo vyjadřující stupeň polynomu. Pokud nenaložíme omezení na velikost tohoto čísla, tak může nabývat libovolně velké hodnoty. Máme-li tedy množinu všech polynomů $\scriptstyle P$ , tak ať nás napadne jakkoli velké $\scriptstyle n$ , tak určitě v této množině nalezneme polynom, jehož stupeň je právě $\scriptstyle n$ . Každý polynom je popsán svými koeficienty, pokud může být ale $\scriptstyle n$ libovolně velké, může být libovolně velký i počet koeficientů polynomu, který "náhodně vytáhneme" z množiny $\scriptstyle P$ . Protože dopředu nevíme, jaký polynom "vytáhneme", musíme uvažovat nejhorší možný případ, tj. když je koeficientů nekonečně mnoho. Pro popis libovolného polynomu z množiny $\scriptstyle P$ je tedy nutno nekonečně mnoho čísel. To je v protikladu k případu šipek v rovině, k jejichž plnému určení stačila čísla dvě. O prostoru šipek pak říkáme, že má dimenzi dva, o prostoru všech polynomů $\scriptstyle P$ pak, že jeho dimenze je nekonečná. Získali jsme tak nejvýraznější charakteristiku vektorových prostorů – buď mají konečnou dimenzi, anebo nekonečnou.

Pojem dimenze lze formalizovat následovně: pokud ve vektorovém prostoru existuje $\scriptstyle k$ vektorů, které jsou lineárně nezávislé, a přitom každý soubor $\scriptstyle k+1$ vektorů už je lineárně závislý, tak má daný vektorový prostor dimenzi rovnou $\scriptstyle k$ . Pokud pro každé $\scriptstyle k$ najdu ve vektorovém prostoru lineárně nezávislý soubor $\scriptstyle k$ vektorů, pak je daný vektorový prostor nekonečné dimenze.

Báze

Pokud má vektorový prostor dimenzi $\scriptstyle n$ , tak v něm nalezneme soubor $\scriptstyle n$ lineárně nezávislých vektorů. Přitom všechny vektory v daném vektorovém prostoru jsme schopní vyjádřit jako jistou lineární kombinaci těchto $\scriptstyle n$ vektorů. Tyto proto nazýváme báze daného vektorového prostoru. Posledně jmenovaná vlastnost plyne z definice dimenze vektorového prostoru. Kdyby totiž existoval vektor, který by nešlo vyjádřit jako lineární kombinaci výše zmíněných $\scriptstyle n$ vektorů, tak bychom obdrželi soubor $\scriptstyle n+1$ vektorů, který je lineárně nezávislý. To je ale ve sporu s tím, že je dimenze prostoru rovna $\scriptstyle n$ .

Vektorový podprostor

Jak již bylo řečeno výše, podprostor vektorového prostoru je taková jeho podmnožina, která je sama o sobě vektorovým prostorem.

Lineární obal

Jedná se o speciální případ podprostoru. Mějme $\scriptstyle k$ vektorů $\scriptstyle {\vec {x}}_{1},{\vec {x}}_{2},\ldots ,{\vec {x}}_{k}$ a uvažujme všechny jejich možné lineární kombinace. Pak množinu všech těchto lineárních kombinací nazýváme lineárním obalem vektorů $\scriptstyle {\vec {x}}_{1},{\vec {x}}_{2},\ldots ,{\vec {x}}_{k}$ . Že se skutečně jedná o podprostor, není těžké dokázat.

Příklady vektorových prostorů

Uveďme si nyní příklady nejčastěji používaných vektorových prostorů. V numerické matematice nejčastěji používanými vektorovými prostory jsou ty konečnědimenzionální, které jsou navíc definované nad číselnými tělesy. Velkou výhodou prostorů konečné dimenze je to, že v nich lze snadno zavést bázi. Každý vektor tak lze popsat pomocí jeho souřadnic v této bázi. Souřadnice přitom tvoří n-tice čísel. Při studiu libovolného konečněrozměrného prostoru se tak stačí omezit na studium prostoru n-tic čísel, jehož vlastnosti si přiblížíme v následujícím oddíle. Z tohoto pohledu jsou co do struktury mnohem bohatší prostory s nekonečnou dimenzí, jako např. prostor spojitých funkcí či prostor posloupností, jejichž příklady zde také uvádíme. Další příklady vektorových prostorů lze nalézt i v oddíle Vektorové prostory s dodatečnou strukturou níže.

Aritmetické vektory

Mějme těleso $\scriptstyle T$ a jisté přirozené číslo $\scriptstyle n$ . Uvažujme dále kartézský součin $\scriptstyle T\times \ldots \times T=T^{n}$ , tj. prostor uspořádaných n-tic prvků z tělesa $\scriptstyle T$ . Na tomto prostoru si definujme operaci sčítání a operaci násobení prvkem z tělesa následovně: Nechť $\scriptstyle {\vec {x}}=(x_{1},x_{2},\ldots ,x_{n})$ a $\scriptstyle {\vec {y}}=(y_{1},y_{2},\ldots ,y_{n})$ jsou dvě uspořádané $\scriptstyle n$ -tice, jejich součet $\scriptstyle {\vec {x}}+{\vec {y}}$ je pak definován jako

{\vec {x}}+{\vec {y}}=(x_{1}+y_{1},x_{2}+y_{2},\ldots ,x_{n}+y_{n}),

tedy jako jiná uspořádaná $\scriptstyle n$ -tice, jejíž složky jsou rovny součtům složek dvou předešlých uspořádaných $\scriptstyle n$ -tic. Nechť dále je $\scriptstyle \alpha$ prvek tělesa, násobek $\scriptstyle \alpha {\vec {x}}$ pak definujeme jako

\alpha {\vec {x}}=(\alpha x_{1},\alpha x_{2},\ldots ,\alpha x_{n}).

Výsledkem je tedy opět uspořádaná $\scriptstyle n$ -tice.

Množina všech uspořádaných $\scriptstyle n$ -tic s tělesem $\scriptstyle T$ a s výše definovanými operacemi sčítání a násobení je vektorový prostor (což lze snadno dokázat z definice vektorového prostoru výše). Nazýváme ho aritmetickým vektorovým prostorem dimenze $\scriptstyle n$ nad tělesem $\scriptstyle T$ (nebo $\scriptstyle n$ -rozměrným aritmetickým vektorovým prostorem nad tělesem $\scriptstyle T$ ). Jeho prvky pak nazýváme aritmetické vektory. Protože je tento typ vektorů používán velmi často, tak se obvykle přívlastek aritmetický vynechává a hovoří se pouze o vektorech. Občas se lze setkat i s frází: vektorový prostor $\scriptstyle T^{n}$ s přirozeně definovanými aritmetickými operacemi či vektorový prostor $\scriptstyle T^{n}$ s přirozeně definovanými operacemi sčítání a násobení. V takovém případě se myslí právě výše zavedený prostor, kde se dva vektory sčítají a násobí číslem po složkách. Můžeme totiž definovat i jiné operace sčítání a násobení číslem, při kterých by prostor uspořádaných $\scriptstyle n$ -tic též tvořil vektorový prostor. Pak bychom mu už ale neříkali aritmetický vektorový prostor.

Prakticky vždy se za těleso bere množina reálných či komplexních čísel, dostáváme tedy prostory $\scriptstyle \mathbb {R} ^{n}$ či $\scriptstyle \mathbb {C} ^{n}$ . Prvky těchto prostorů se obvykle značí jako sloupce

{\vec {x}}={\begin{pmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{pmatrix}},

kde $\scriptstyle n$ udává počet složek. Takto zapisovaným $\scriptstyle n$ -ticím říkáme sloupcové vektory. Lze se ale setkat i s vektory psanými do řádku

{\vec {x}}=(x_{1},x_{2},\ldots ,x_{n}),

které nazýváme řádkové vektory. Pro práci se sloupcovými vektory viz Příklad 1 v článku Lineární kombinace, Příklad 1 v článku Lineární nezávislost či Příklad 1 a Příklad 2 v článku Lineární obal. Pokud pracujeme pouze se samotnými aritmetickými vektory, tak je jedno, zda používáme řádkový či sloupcový zápis. Rozdíl ale začne být patrný, budeme-li chtít těmito vektory násobit matici. Více viz články Sloupcový vektor a Řádkový vektor. Prostor uspořádaných n-tic má dimenzi rovnou n. Jednotlivé složky obecného n-složkového aritmetického vektoru jsou totiž navzájem nezávislé a k určení každého vektoru v daném vektorovém prostoru je tedy třeba právě n čísel.

Jak bylo ukázáno v Motivaci, prostor šipek v rovině odpovídá prostoru dvousložkových aritmetických vektorů. Přesněji řečeno, námi rozebíraný případ je případ aritmetického vektorového prostoru $\scriptstyle \mathbb {R} ^{2}$ definovaného nad tělesem reálných čísel $\scriptstyle \mathbb {R}$ a s přirozeně zavedenými aritmetickými operacemi. Prostor šipek ve trojrozměrném prostoru by odpovídal množině $\scriptstyle \mathbb {R} ^{3}$ . Analogicky pak prostor šipek v $\scriptstyle k$ -rozměrném prostoru odpovídá množině $\scriptstyle \mathbb {R} ^{k}$ nad tělesem $\scriptstyle \mathbb {R}$ s přirozeně definovanými operacemi sčítání a násobení.

Matice

V předchozím oddílu jsme zkoumali prostor uspořádaných n-tic čísel, tedy prvků množiny $\scriptstyle T^{n}$ . Podívejme se nyní na lehce obecnější množinu $\scriptstyle T^{n,m}\equiv T^{n\times m}$ , která vznikne jako kartézský součin n krát m množin, z nichž každá je rovna tělesu $\scriptstyle T$ . Jedná se tedy prakticky o množinu uspořádaných $\scriptstyle k$ -tic, kde $\scriptstyle k=n\cdot m$ . Oproti aritmetickým vektorům ale uděláme jednu věc navíc. Jednotlivé složky prvku z $\scriptstyle T^{n,m}$ totiž seřadíme do obdélníku o rozměrech n krát m, jak je uvedeno níže

\mathbb {A} \in T^{n,m}\quad \Leftrightarrow \quad \mathbb {A} ={\begin{pmatrix}a_{11}&a_{12}&\ldots &a_{1m}\\a_{21}&a_{22}&\ldots &a_{2m}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\ldots &a_{nm}\end{pmatrix}}.

Takovýmto objektům se říká matice. Je obvyklé označovat matice velkými tučnými či konturovými písmeny, jak je vyznačeno výše. Mohli jsme ale stejně tak místo $\scriptstyle \mathbb {A}$ psát $\scriptstyle {\vec {x}}$ , jedná se pouze o značení. Máme tedy množinu $\scriptstyle T^{n,m}$ , těleso $\scriptstyle T$ . Zbývá nám tedy definovat operaci sčítání a operaci násobení. Obě definujeme stejně jako v případě aritmetických vektorů, tzn.

\mathbb {A} +\mathbb {B} ={\begin{pmatrix}a_{11}&a_{12}&\ldots &a_{1m}\\a_{21}&a_{22}&\ldots &a_{2m}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\ldots &a_{nm}\end{pmatrix}}+{\begin{pmatrix}b_{11}&b_{12}&\ldots &b_{1m}\\b_{21}&b_{22}&\ldots &b_{2m}\\\vdots &\vdots &\ddots &\vdots \\b_{n1}&b_{n2}&\ldots &b_{nm}\end{pmatrix}}={\begin{pmatrix}a_{11}+b_{11}&a_{12}+b_{12}&\ldots &a_{1m}+b_{1m}\\a_{21}+b_{21}&a_{22}+b_{22}&\ldots &a_{2m}+b_{2m}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}+b_{n1}&a_{n2}+b_{n2}&\ldots &a_{nm}+b_{nm}\end{pmatrix}},\qquad \alpha \mathbb {A} ={\begin{pmatrix}\alpha a_{11}&\alpha a_{12}&\ldots &\alpha a_{1m}\\\alpha a_{21}&\alpha a_{22}&\ldots &\alpha a_{2m}\\\vdots &\vdots &\ddots &\vdots \\\alpha a_{n1}&\alpha a_{n2}&\ldots &\alpha a_{nm}\end{pmatrix}}.

Tento způsob sčítání, resp. násobení, se označuje jako sčítání, resp. násobení po složkách. Jedná se o klasický způsob zavedení těchto operací, kterým tak občas říkáme "přirozeně definované aritmetické operace". S takto definovanými operacemi lze snadno ukázat, že množina $\scriptstyle T^{n,m}$ s tělesem $\scriptstyle T$ tvoří vektorový prostor. Opět se nejčastěji za $\scriptstyle T$ bere množina reálných či komplexních čísel.

To, že jsme jednotlivé složky vektoru alias matice uspořádali do obdélníku ještě nic neznamená, stále s nimi totiž pracujeme jako s aritmetickými vektory. Rozdíl nastává teprve v tom, že pro matice můžeme definovat i jejich vzájemné násobení. Můžeme tedy násobit spolu dva vektory (matice), v obecném případě můžeme pouze vektor násobit prvkem z tělesa (číslem). Možnost násobit mezi sebou matice je ale mimo rámec definice vektorového prostoru a není pro jeho zavedení nutná. Čtenáře proto pro podrobnosti odkážeme na článek Matice. Analogicky jako v případě aritmetických vektorů by se ukázalo, že dimenze prostoru $\scriptstyle T^{n,m}$ je $\scriptstyle n\cdot m$ .

Lineární operátory

Dosud jsme se zabývali vektorovými prostory $\scriptstyle (V,T,\oplus ,\odot )$ . Uvažujme nyní zobrazení množiny $\scriptstyle V$ na sebe. Jinými slovy, uvažujme zobrazení $\scriptstyle L:V\to V$ , které vezme vektor z $\scriptstyle V$ a vrátí obecně nějaký jiný vektor z $\scriptstyle V$ . Na vlastnosti tohoto zobrazení $\scriptstyle L$ naklademe dvě podmínky:

$(\forall {\vec {x}}\in V)(\forall {\vec {y}}\in V)(L({\vec {x}}+{\vec {y}})=L({\vec {x}})+L({\vec {y}})),$
$(\forall {\vec {x}}\in V)(\forall \alpha \in T)(L(\alpha {\vec {x}})=\alpha L({\vec {x}})).$

První podmínku lze vyjádřit slovy "obraz součtu je součet obrazů" a matematicky se nazývá aditivita. Druhou podmínku pak můžeme popsat jako "obraz násobku je násobek obrazu" a matematicky se jí říká homogenita. Zobrazení splňujícímu výše uvedené podmínky se říká lineární operátor. Nechť je nyní vektorový prostor $\scriptstyle V$ konečné dimenze, můžeme pro konkrétnost brát aritmetický vektorový prostor dimenze $\scriptstyle n$ . Pak lineární operátor $\scriptstyle L$ působící na tomto prostoru bere aritmetické vektory a vrací jiné aritmetické vektory, přičemž splňuje vlastnost

L(\alpha {\vec {x}}+{\vec {y}})=L(\alpha {\vec {x}})+L({\vec {y}})=\alpha L({\vec {x}})+L({\vec {y}}).

Uvažujme nějaké dva lineární operátory $\scriptstyle A,B$ působící na $\scriptstyle V$ . Podobně jako v případě běžných funkcí bychom i nyní chtěli tyto dva lineární operátory umět sečíst. Chtěli bychom si tedy zavést, co to přesně znamená, když operátor $\scriptstyle A$ sečteme s operátorem $\scriptstyle B$ . Jak by mnohého napadlo, definujeme si součet dvou lineárních operátorů následovně

(A+B)({\vec {x}})=A({\vec {x}})+B({\vec {x}}),

kde $\scriptstyle {\vec {x}}\in V$ je libovolný vektor z prostoru $\scriptstyle V$ . Na levé straně poslední rovnosti vystupuje jediný lineární operátor, který jsme si označili jako $\scriptstyle A+B$ a nazýváme ho součet lineárních operátorů $\scriptstyle A$ a $\scriptstyle B$ . Výrazem výše jsme tak definovali hodnotu tohoto lineárního operátoru pomocí hodnot operátorů $\scriptstyle A$ a $\scriptstyle B$ . Podobně si definujme i násobek lineárního operátoru prvkem z tělesa jako

(\alpha A)({\vec {x}})=\alpha A({\vec {x}}),

kde opět $\scriptstyle {\vec {x}}\in V$ je libovolný vektor z prostoru $\scriptstyle V$ a na levé straně rovnosti vystupuje operátor, který jsme si označili jako $\scriptstyle \alpha A$ . Jeho hodnotu pro každý vektor $\scriptstyle {\vec {x}}$ jsme pak definovali výrazem na pravé straně rovnosti. Znovu zdůrazněme, že nyní nesčítáme vektory a nenásobíme vektory z $\scriptstyle V$ , ale samotné lineární operátory. Označme množinu všech lineárních operátorů působících na prostoru $\scriptstyle V$ jako $\scriptstyle {\mathcal {L}}(V)$ . O této množině lze ukázat, že spolu s tělesem $\scriptstyle T$ a právě zavedenými operacemi sčítání a násobení tvoří vektorový prostor. Máme tedy vektorový prostor lineárních operátorů $\scriptstyle {\mathcal {L}}(V)$ , z nichž každý působí na dalším vektorovém prostoru, prostoru $\scriptstyle V$ (!) Lineární operátory jsou navíc jen speciálním případem obecnějšího druhu zobrazení, které nazýváme lineární zobrazení. Ta mají stejné vlastnosti jako lineární operátory až na to, že místo toho, aby vraceli své hodnoty do vektorového prostoru $\scriptstyle V$ , tak je vrací do ještě dalšího vektorového prostoru, označme si ho $\scriptstyle W$ . Lineární zobrazení je tedy zobrazení z vektorového prostoru $\scriptstyle V$ do vektorového prostoru $\scriptstyle W$ , které splňuje podmínku aditivity a homogenity (viz výše). I tato zobrazení můžeme sčítat a násobit prvkem z tělesa. Podobně jako pro lineární operátory by se i u těchto zobrazení dalo ukázat, že tvoří vektorový prostor. Jedná se o vektorový prostor zobrazení, která berou vektory z jednoho vektorového prostoru $\scriptstyle V$ a vrací hodnoty do jiného vektorového prostoru $\scriptstyle W$ .

Dimenze prostoru všech lineárních operátorů $\scriptstyle {\mathcal {L}}(V)$ závisí na dimenzi vektorového prostoru $\scriptstyle V$ , na kterém tyto operátory působí. Pokud je dimenze $\scriptstyle V$ nekonečná, pak je nekonečná i dimenze prostoru $\scriptstyle {\mathcal {L}}(V)$ . Pokud je dimenze prostoru $\scriptstyle V$ konečná a rovná jistému přirozenému číslu $\scriptstyle n$ , pak je dimenze prostoru $\scriptstyle {\mathcal {L}}(V)$ taky konečná a je rovna $\scriptstyle n^{2}$ . Máme-li totiž vektor $\scriptstyle {\vec {x}}$ z vektorového prostoru $\scriptstyle V$ dimenze $\scriptstyle n$ , tak jsme tento vektor schopni vyjádřit jako lineární kombinaci vektorů báze. Označme si tyto vektory báze jako $\scriptstyle ({\vec {e}}_{1},{\vec {e}}_{2},\ldots ,{\vec {e}}_{n})$ , pak

{\vec {x}}=\sum _{i=1}^{n}\alpha _{i}{\vec {e}}_{i},

kde $\scriptstyle \alpha _{i}$ jsou souřadnice vektoru $\scriptstyle {\vec {x}}$ ve zvolené bázi. Když zapůsobíme na $\scriptstyle {\vec {x}}$ lineárním operátorem $\scriptstyle L$ , tak z definice vlastností tohoto operátoru plyne

L({\vec {x}})=L{\big (}\sum _{i=1}^{n}\alpha _{i}{\vec {e}}_{i}{\big )}=\sum _{i=1}^{n}\alpha _{i}L({\vec {e}}_{i})=\sum _{i=1}^{n}\alpha _{i}{\vec {l}}_{i},

kde jsme označili $\scriptstyle {\vec {l}}_{i}=L(e_{i})$ . Vektory $\scriptstyle {\vec {l}}_{i}$ ale zase leží ve $\scriptstyle V$ , můžeme je tedy vyjádřit v bázi $\scriptstyle ({\vec {e}}_{1},{\vec {e}}_{2},\ldots ,{\vec {e}}_{n})$

{\vec {l}}_{i}=\sum _{j=1}^{n}\beta _{ij}{\vec {e}}_{j}

pro každé $\scriptstyle i\in \{1,\ldots ,n\}$ . Celkově tak můžeme psát

L({\vec {x}})=\sum _{i=1}^{n}\sum _{j=1}^{n}\alpha _{i}\beta _{ij}{\vec {e}}_{j}.

Koeficienty $\scriptstyle \beta _{ij}$ popisují působení lineárního operátoru $\scriptstyle L$ na vektory z $\scriptstyle V$ . Těchto koeficientů je zjevně dohromady $\scriptstyle n^{2}$ . Máme tedy $\scriptstyle n^{2}$ čísel, pomocí nichž můžeme popsat libovolný operátor působící na $\scriptstyle V$ a dimenze prostoru $\scriptstyle {\mathcal {L}}(V)$ je tedy rovna tomuto číslu.

Posloupnosti

Jistým zobecněním aritmetických vektorů na nekonečnou dimenzi jsou posloupnosti prvků z tělesa. Místo uspořádaných n-tic nyní bereme posloupnosti, které mají složek nekonečně mnoho. Operace sčítání a násobení prvkem z tělesa můžeme zavést podobně jako pro aritmetické vektory. Podobně bychom i ověřili, že množina všech posloupností prvků daného tělesa tvoří vektorový prostor. Nulovým vektorem by byla posloupnost nul, opačný vektorem k dané posloupnosti by byla posloupnost opačných prvků atd. Více nás ale zajímají posloupnosti, které konvergují. Aby tyto posloupnosti vůbec tvořily vektorový prostor, tak ale nejprve musíme zjistit, zda součet konvergentních posloupností je opět konvergentní posloupnost a podobně pro násobek. Omezíme-li se nyní na těleso reálných čísel a využijeme vlastností limity

\lim _{k\to \infty }(a_{k}+b_{k})=\lim _{k\to \infty }(a_{k})+\lim _{k\to \infty }(b_{k}),\quad \lim _{k\to \infty }(\alpha a_{k})=\alpha \lim _{k\to \infty }(a_{k}).

vidíme, že součet dvou konvergentních posloupností $\scriptstyle (a_{k}),(b_{k})$ je konvergentní posloupnost a totéž platí i pro $\scriptstyle \alpha \in \mathbb {R}$ násobek konvergentní posloupnosti. Množina reálných konvergentních posloupností je tedy uzavřená na součet svých prvků a na násobení svých prvků číslem. Tato množina tvoří podprostor vektorového prostoru všech posloupností reálných čísel. Viz též Příklad 3 v článku Vektorový podprostor. Ač jsou kvůli konvergenci na prvky posloupnosti nakladena jistá omezení, má prostor konvergentních posloupností nekonečnou dimenzi. Jedná se tedy o nekonečnědimezionální podprostor prostoru všech posloupností.

Spojité funkce

Uvažujme nyní množinu všech spojitých reálných funkcí jedné reálné proměnné. K ní si vezměme těleso reálných čísel a definujme si operace sčítání dvou funkcí a násobení funkce číslem bodově: pro libovolné dvě funkce $\scriptstyle f,g$ a číslo $\scriptstyle \alpha \in \mathbb {R}$ mějme

(f+g)(x)=f(x)+g(x),\quad (\alpha f)(x)=\alpha f(x),

kde $\scriptstyle x$ probíhá reálnou osu. V matematické analýze se dokazuje, že součet dvou spojitých funkcí je opět spojitá funkce. Podobně násobek spojité funkce je spojitá funkce. Množina všech spojitých reálných funkcí reálné proměnné je tedy uzavřená na sčítání funkcí a násobení funkcí číslem, což je nutný předpoklad k tomu, aby mohla být vektorovým prostorem. Ověřením axiomů vektorového prostoru se dá skutečně dokázat, že tato množina tvoří vektorový prostor. Tento prostor přitom představuje podprostor v prostoru všech reálných funkcí reálné proměnné, viz Příklad 2 v článku Vektorový podprostor. Lze též dokázat, že vektorový prostor uvažovaných spojitých funkcí je nekonečné dimenze.

Polynomy

V Motivaci jsme použili prostor všech polynomů (všech číselných polynomů jedné reálné proměnné), abychom se abstrakcí jeho vlastností dobrali pojmu vektorový prostor. Není těžké ověřit, že tato množina skutečně splňuje všechny axiomy vektorového prostoru, kde součet a násobek polynomů je definován stejně jako pro všechny ostatní spojité funkce, viz předchozí příklad. Dále, v oddíle Dimenze výše bylo naznačeno, že vektorový prostor všech polynomů je nekonečněrozměrný, značíme ho $\scriptstyle {\mathcal {P}}$ . Můžeme v něm ale najít jistou podmnožinu, která bude tvořit konečněrozměrný vektorový podprostor. Máme na mysli konkrétně množinu všech polynomů, jejichž stupeň je menší nebo roven jistému zadanému přirozenému číslu n. Je snadné si rozmyslet, že součtem polynomů, jejichž stupeň je menší než n opět dostanu polynom se stupněm nepřevyšujícím n. Podobně pro násobek polynomu číslem. Označme si množinu těchto polynomů jako $\scriptstyle {\mathcal {P}}_{n+1}$ . Do této množiny zahrnujeme i nulový polynom, jehož stupeň se obvykle nedefinuje. Protože je polynom stupně n popsán n+1 koeficienty (jeden koeficient u každé mocniny nezávisle proměnné plus absolutní člen, u něhož žádná mocnina není), je dimenze prostoru $\scriptstyle {\mathcal {P}}_{n+1}$ rovna n+1.

Vektorové prostory s dodatečnou strukturou

V praxi je velmi užitečné vybavit vektorový prostor dodatečnou strukturou. Příkladem může být např. zavedení pojmu délky, čímž se vektorový prostor stane navíc metrickým prostorem. Formálně se tento pojem zavádí jako jisté zobrazení z množiny vektorů do množiny kladných (reálných) čísel. Tomuto zobrazení se říká norma a musí splňovat jisté podmínky, viz níže oddíl Normované vektorové prostory. Dále můžeme zavést na vektorovém prostoru skalární součin, který nám mj. umožní měřit úhly mezi dvěma vektory, viz Prostory se skalárním součinem níže. Pokročilejším příkladem zavedení dodatečné struktury na vektorovém prostoru se pak zabývá oddíl Topologický vektorový prostor.

Normované vektorové prostory

Uvažujme v dalším vektorový prostor $\scriptstyle V$ nad číselným tělesem $\scriptstyle T$ . Jak bylo zmíněno v úvodu nadřazené sekce, je z různých důvodů velmi užitečné zavést ve vektorovém prostoru pojem délky. Matematicky je tento realizován pomocí pomocného zobrazení zvaného norma, které zobrazuje vektorový prostor do množiny nezáporných (reálných) čísel. Každému vektoru je tedy jednoznačně přiřazeno nezáporné číslo – jeho "délka". Je přitom přirozené požadovat, aby měl nulový vektor nulovou délku a žádný jiný vektor nulovou délku neměl. Neboli, nulovou délku má právě jen nulový vektor. Dále požadujeme, že prodloužíme-li daný vektor $\scriptstyle \alpha$ -krát, tak i jeho délka vzroste $\scriptstyle \alpha$ -krát (pro $\scriptstyle \alpha$ kladné, jinak bychom brali absolutní hodnotu $\scriptstyle |\alpha |$ ). Nakonec, protože je norma zobecněním pojmu absolutní hodnoty na reálných číslech, tak od ní požadujeme splnění trojúhelníkové nerovnosti. Že se jedná též o přirozený požadavek je názorně vidět z příkladu šipek v rovině, viz Motivace a obrázek Obr. 3., kde součet délek šipek $\scriptstyle {\vec {x}}_{1}$ a $\scriptstyle {\vec {x}}_{2}$ musí být alespoň tak velký jako délka šipky $\scriptstyle {\vec {x}}_{1}+{\vec {x}}_{2}={\vec {x}}_{3}$ . Jinak bychom nemohli sestrojit trojúhelník o stranách $\scriptstyle {\vec {x}}_{1}$ , $\scriptstyle {\vec {x}}_{2}$ a $\scriptstyle {\vec {x}}_{3}$ . Přeformulujeme-li právě uvedené požadavky do matematické podoby, dostáváme matematickou definici normy:

Norma, značíme $\scriptstyle \|\cdot \|$ , je zobrazení vektorového prostoru $\scriptstyle V$ (nad tělesem $\scriptstyle T$ ) do nezáporných čísel, $\scriptstyle \|\cdot \|:V\to \mathbb {R} _{0}^{+}$ , splňující následující tři požadavky:

$(\forall {\vec {x}}\in V)(\|{\vec {x}}\|=0\Leftrightarrow {\vec {x}}={\vec {0}}),$
$(\forall \alpha \in T)(\|\alpha {\vec {x}}\|=|\alpha |\|{\vec {x}}\|),$
$(\forall {\vec {x}}\in V)(\forall {\vec {y}}\in V)(\|{\vec {x}}+{\vec {y}}\|\leq \|{\vec {x}}\|+\|{\vec {y}}\|).$

Zavedením normy na vektorovém prostoru se tento stává metrickým prostorem. Norma totiž vyhovuje definičním podmínkám metriky. Níže si uvedeme pár příkladů normovaných vektorových prostorů. Další příklady normovaných prostorů lze přitom nalézt v sekci Prostory se skalárním součinem, neboť skalární součin indukuje normu a každý prostor se skalárním součinem je tak automaticky i normovaným vektorovým prostorem.

Aritmetické prostory

Vraťme se nejprve k vektorovým prostorům aritmetických vektorů a ukažme, jak lze na těchto prostorech zavést normu. Uvažujme číselné těleso $\scriptstyle T$ a aritmetický prostor $\scriptstyle \mathbb {R} ^{n}$ , popř. $\scriptstyle \mathbb {C} ^{n}$ , kde $\scriptstyle n\geq 1$ je pevně dané přirozené číslo (viz výše). Vektory jsou tedy uspořádané n-tice, $\scriptstyle {\vec {x}}=(x_{1},x_{2},\ldots ,x_{n})$ . V definici normy nebyl nijak specifikován explicitní tvar tohoto zobrazení a možností, jak zvolit normu je tedy mnoho. V praxi se však často vymezuje jistá třída norem, kterým se občas říká p-normy. Jejich definice zní takto

\|{\vec {x}}\|_{p}={\Big (}\sum _{i=1}^{n}|x_{i}|^{p}{\Big )}^{\frac {1}{p}},\quad {\text{popřípadě}}\quad \|{\vec {x}}\|_{\infty }=\max _{1\leq i\leq n}|x_{i}|,

kde $\scriptstyle \|\cdot \|_{p}$ , popř. $\scriptstyle \|\cdot \|_{\infty }$ označuje danou p-normu. Pro $\scriptstyle p=2$ dostáváme klasickou Euklidovu normu vektoru. Dokázat první a druhou definiční vlastnost normy pro právě zavedená zobrazení je snadné. Pro důkaz trojúhelníkové nerovnosti lze pak použít Minkowského nerovnosti. Máme tak nyní vektorový prostor aritmetických vektorů, na němž je definován jednoparametrický systém norem. Pro práci s vektory a pro měření jejich délek si vždy zvolíme tu normu, s níž se nám v daném kontextu nejlépe pracuje.

Prostory matic

Výše jsme se zmínili, že matice mají velmi podobnou strukturu jako aritmetické vektory. Podobně jako na těchto vektorech bychom analogicky mohli zavést normu i na maticích obecných rozměrů. Na rozdíl od aritmetickým vektorů jsou však složky matic rozloženy do obdélníku, kterážto vlastnost umožňuje definovat násobek dvou matic. Obě matice přitom musí splňovat jednoduché požadavky na své rozměry. Násobit tedy nelze jakékoliv dvě matice. Pokud se ale omezíme jen na čtvercové matice (tj. ty mající stejný počet řádků a sloupců), tak toto omezení odpadá. Uvažujme nyní tedy prostor všech čtvercových matic řádu n a za těleso vezměme množinu reálných či komplexních čísel. Na tomto prostoru lze také zavést normu. V případě matic se ale kromě tří požadavků v definici normy požaduje ještě jedna vlastnost související s násobením matic. A sice

(\forall \mathbb {A} \in T^{n,n})(\forall \mathbb {B} \in T^{n,n})(\|\mathbb {A} \mathbb {B} \|\leq \|\mathbb {A} \|\|\mathbb {B} \|),

kde $\scriptstyle T$ je buď množina reálných či komplexních čísel. Norma na prostoru matic je tedy zobrazení, které matici přiřadí nezáporné číslo a splňuje přitom čtyři požadavky zmíněné výše. Pokud bychom uvažovali prostor matic, které nejsou obdélníkové a které tedy nelze mezi sebou násobit, tak čtvrtý požadavek odpadá, protože nemá smysl. Norem na prostoru matic existuje nekonečně mnoho, v praxi se jich však používá jen pár. Příkladem je např. Euklidova norma, které se též říká Frobeniova norma či Hilbert-Schmidtova norma a která je pro libovolnou matici $\scriptstyle \mathbb {A} \in T^{n,n}$ definována následovně

\|\mathbb {A} \|_{2}={\sqrt {\sum _{i=1}^{n}\sum _{j=1}^{n}|a_{ij}|^{2}}},

kde $\scriptstyle a_{ij}$ jsou prvky matice $\scriptstyle \mathbb {A}$ . Jak je vidno, Euklidova norma na prostoru matic je přímým zobecněním Euklidovy normy na prostorech aritmetických vektorů.

Prostory lineárních operátorů

Jak jsme si výše ukázali, lineární operátor definovaný na vektorovém prostoru dimenze $\scriptstyle n$ lze popsat pomocí $\scriptstyle n^{2}$ čísel (uvažujeme-li prostory nad číselnými tělesy). Tato čísla přitom můžeme uspořádat do čtvercové matice řádu $\scriptstyle n$ , čímž dostáváme matici lineárního operátoru. Každému lineárnímu operátoru tak přísluší jistá matice. Na vektorový prostor lineárních operátorů se tedy můžeme dívat podobně jako na prostor matic a obdobným způsobem na něm zavést normu, viz předchozí příklad. Násobení matic pak odpovídá skládání lineárních operátorů.

Zaměřme se nyní na lineární operátory definované na normovaném vektorovém prostoru $\scriptstyle V$ nekonečné dimenze. Tyto operátory už nelze popsat maticí. Ta by totiž musela mít nekonečně mnoho řádků a sloupců. Mezi všemi operátory však můžeme vymezit podmnožinu tvořenou spojitými operátory, kterým se běžně říká omezené operátory. Pro každý omezený operátor $\scriptstyle L$ existuje kladné číslo $\scriptstyle C_{L}$ takové, že pro libovolný vektor $\scriptstyle {\vec {x}}\in V$ platí nerovnost

\|L({\vec {x}})\|\leq C_{L}\cdot \|{\vec {x}}\|.

Obraz vektoru $\scriptstyle {\vec {x}}$ při zobrazení $\scriptstyle L$ má tedy normu nejvýše $\scriptstyle C_{L}$ -krát větší, než je norma původního vektoru $\scriptstyle {\vec {x}}$ . Zatím tedy uvažujeme, že je operátor definovaný na normovaném prostoru, do něhož spadají vektory $\scriptstyle {\vec {x}}$ . Chceme nyní definovat normu samotného lineárního zobrazení.

Z právě uvedené definice je lineární operátor $\scriptstyle L$ omezený, pokud existuje alespoň jedno číslo $\scriptstyle C_{L}$ s vlastností výše. Takových čísel ale může být více, může jich být dokonce nekonečně mnoho. Když budeme uvažovat infimum množiny všech těchto čísel, tak dostaneme opět číslo, které splňuje danou vlastnost. Toto číslo nazýváme norma omezeného lineárního operátoru $\scriptstyle L$ . V symbolech

\|L\|=\inf\{C_{L}\}.

Ačkoli jsme právě zavedli objekt, jenž jsme pojmenovali norma, neověřili jsme dosud, že skutečně splňuje definiční podmínky normy. Je tedy potřeba dokázat, že právě zavedené zobrazení, které omezenému lineárnímu operátoru přiřazuje infimum jisté množiny, skutečně normou je. To není těžké nahlédnout, vyjdeme-li z vlastností normy na vektorovém prostoru $\scriptstyle V$ . Dokonce je pak rovnou splněn i vztah analogický čtvrtému požadavku na normu v prostoru matic. Sice

\|(AB)\|\leq \|A\|\cdot \|B\|,

kde $\scriptstyle A,B$ jsou omezené lineární operátory a $\scriptstyle AB$ je jejich složení. Máme-li již dokázané vlastnosti normy, můžeme právě uvedenou nerovnost odvodit následovně

\|(AB)({\vec {x}})\|=\|A(B({\vec {x}}))\|\leq \|A\|\cdot \|B({\vec {x}})\|\leq \|A\|\cdot \|B\|\cdot \|{\vec {x}}\|,

kde jsme v první rovnosti využili vlastností skládání zobrazení a pak po řadě definice normy pro operátor $\scriptstyle A$ a $\scriptstyle B$ . Jak vidíme, číslo $\scriptstyle \|A\|\cdot \|B\|$ je příkladem čísla $\scriptstyle C_{L}$ z definice výše, když položíme $\scriptstyle L=AB$ . Protože norma operátoru $\scriptstyle AB$ je z definice infimum všech čísel $\scriptstyle C_{L}$ , je nutně

\|AB\|\leq \|A\|\cdot \|B\|,

což bylo dokázat.

Vektorový prostor omezených lineárních operátorů definovaných na nekonečněrozměrném normovaném vektorovém prostoru je tedy také nekonečněrozměrný normovaný vektorový prostor.

l^p prostory

Výše jsme se zmínili o prostoru konvergentních posloupností. V této množině můžeme dále rozlišovat podmnožiny číselných posloupností, které konvergují "různě rychle". Matematicky je tento fakt zachycen v definici l^p prostorů (l zde označuje malé písmeno L). Definice těchto prostorů umožňuje přímočaře zavést normu a jsou tak jedním z příkladů normovaných vektorových prostorů. Norma je přitom zavedena v analogii na $\scriptstyle p$ -normy aritmetických vektorů, jak je naznačeno v předchozím příkladě. Konkrétně se pro dané $\scriptstyle p\geq 1$ definuje

l^{p}={\Big \{}(a_{n})_{n=1}^{\infty }\in \mathbb {C} {\Big |}\sum _{n=1}^{\infty }|a_{n}|^{p}<+\infty {\Big \}}.

Navíc se dodefinovává

l^{\infty }={\Big \{}(a_{n})_{n=1}^{\infty }\in \mathbb {C} {\Big |}\sup _{1\leq n<\infty }|a_{n}|<+\infty {\Big \}},

kde $\scriptstyle \sup$ označuje supremum všech prvků posloupnosti. O těchto množinách se dá díky Minkowského nerovnosti ukázat, že jsou uzavřené na součet dvou svých prvků. Součtem dvou řad z dané množiny dostaneme opět prvek dané množiny a má smysl hovořit o zavedení vektorového prostoru. Ověření axiomů vektorového prostoru je pak již rutinní záležitost. Normu lze v takovýchto prostorech definovat jako

\|(a_{n})\|_{p}={\Big (}\sum _{n=1}^{\infty }|a_{n}|^{p}{\Big )}^{\frac {1}{p}},\quad {\text{popřípadě}}\quad \|(a_{n})\|_{\infty }=\sup _{1\leq n<\infty }|a_{n}|.

K ověření, že takto definované zobrazení, které číselné posloupnosti přiřadí nezáporné číslo, splňuje trojúhelníkovou nerovnost přitom opět můžeme s úspěchem použít Minkowského nerovnosti. Dostali jsme tak rovnou jednoparametrický systém normovaných prostorů, pro každou konkrétní hodnotu parametru $\scriptstyle p\in \langle 1,\infty \rangle$ máme daný l^p prostor s danou $\scriptstyle p$ normou.

L^p prostory

Analogii, či spíše zobecnění, l^p prostorů představují L^p prostory. Zde se oproti předchozímu příkladu neuvažují číselné posloupnosti, ale měřitelné funkce. V definičních podmínkách se pak místo sum objevují integrály. Konkrétně nechť $\scriptstyle (X,\Sigma ,\mu )$ je prostor s mírou, pak pro $\scriptstyle p\geq 1$ definujeme

L^{p}={\Big \{}f{\Big |}\ \int _{X}|f|^{p}\,\mathrm {d} \mu <+\infty ,\ f{\text{ je měřitelná funkce na }}X{\Big \}}.

Navíc se dodefinovává

L^{\infty }={\Big \{}f{\Big |}\ {\textrm {esssup}}_{x\in X}|f(x)|<+\infty ,\ f{\text{ je měřitelná funkce na }}X{\Big \}},

kde $\scriptstyle {\textrm {esssup}}$ označuje esenciální supremum funkce $\scriptstyle f$ na množině $\scriptstyle X$ . Analogicky jako v případě l^p prostorů bychom pomocí integrální podoby Minkowského nerovnosti ověřili uzavřenost daných množin na součet dvou funkcí a platnost axiomů vektorového prostoru (kde uvažujeme klasické sčítání funkcí a jejich násobení číslem). Definice daných množin nás opět přímočaře vede na definici normy

\|f\|_{p}={\Big (}\int _{X}|f|^{p}\,\mathrm {d} \mu {\Big )}^{\frac {1}{p}},\quad {\text{popřípadě}}\quad \|f\|_{\infty }={\textrm {esssup}}_{x\in X}|f(x)|.

Při ověřování trojúhelníkové nerovnosti bychom přitom opět využili integrální podoby Minkowského nerovnosti. Pro každé $\scriptstyle p\in \langle 1,\infty \rangle$ tak máme daný L^p prostor s danou $\scriptstyle p$ normou.

Prostory se skalárním součinem

Dalším příkladem zobrazení, kterým můžeme dodatečně vybavit vektorový prostor, je skalární součin. Toto zobrazení nám umožňuje například zavést úhly mezi vektory či ortogonalitu. Shrňme si v krátkosti definici skalárního součinu na vektorovém prostoru $\scriptstyle V$ (nad číselným tělesem $\scriptstyle T$ ) následovně:

Skalární součin, značíme $\scriptstyle (\cdot ,\cdot )$ , je zobrazení $\scriptstyle (\cdot ,\cdot ):V\times V\to T$ , které každé dvojici vektorů přiřadí (obecně komplexní) číslo a splňuje následující čtyři podmínky:

$(\forall {\vec {x}}\in V)(({\vec {x}},{\vec {x}})\geq 0),$
$(\forall {\vec {x}}\in V)(({\vec {x}},{\vec {x}})=0\Leftrightarrow {\vec {x}}={\vec {0}}),$
$(\forall {\vec {x}}\in V)(\forall {\vec {y}}\in V)(({\vec {x}},{\vec {y}})={\overline {({\vec {y}},{\vec {x}})}}),$
$(\forall {\vec {x}}\in V)(\forall {\vec {y}}\in V)(\forall \alpha \in T)(({\vec {x}},\alpha {\vec {y}}+{\vec {z}})={\overline {\alpha }}({\vec {x}},{\vec {y}})+({\vec {x}},{\vec {z}})),$

kde pruh nad číslem označuje jeho komplexní sdružení. Jinými slovy, skalární součin je pozitivní nedegenerovaná sesquilineární forma.

O dvou vektorech $\scriptstyle {\vec {x}},{\vec {y}}$ pak říkáme, že jsou na sebe kolmé, resp. že jsou ortogonální, právě když jejich skalární součin je nula, tj. $\scriptstyle ({\vec {x}},{\vec {y}})=0$ . Máme-li navíc zadaný skalární součin, tak jsme s jeho pomocí schopni zavést i normu. Norma se pomocí skalárního součinu přitom zavádí kanonicky následovně: máme-li $\scriptstyle (\cdot ,\cdot )$ skalární součin, tak můžeme definovat zobrazení $\scriptstyle \|\cdot \|$ tak, že

\|{\vec {x}}\|={\sqrt {({\vec {x}},{\vec {x}})}}

pro každý vektor $\scriptstyle {\vec {x}}\in V$ . První požadavek v definici skalárního součinu nám přitom zajišťuje, že se pod odmocninou objeví jen nezáporná čísla a odmocnina tak má vždy v reálných číslech smysl. Ověřme nyní, že právě zavedené zobrazení je skutečně norma. První a druhý požadavek, jak jsou uvedeny v oddíle Normované vektorové prostory, je snadné dokázat. Zaměřme se na požadavek třetí, tedy trojúhelníkovou nerovnost. Využijeme-li vlastností skalárního součinu, obdržíme

\|{\vec {x}}+{\vec {y}}\|={\sqrt {({\vec {x}}+{\vec {y}},{\vec {x}}+{\vec {y}})}}={\sqrt {({\vec {x}},{\vec {x}})+({\vec {x}},{\vec {y}})+({\vec {y}},{\vec {x}})+({\vec {y}},{\vec {y}})}}={\sqrt {{\big (}{\sqrt {({\vec {x}},{\vec {x}})}}{\big )}^{2}+({\vec {x}},{\vec {y}})+{\overline {({\vec {x}},{\vec {y}})}}+{\big (}{\sqrt {({\vec {y}},{\vec {y}})}}{\big )}^{2}}}={\sqrt {\|{\vec {x}}\|^{2}+2{\text{Re}}\{({\vec {x}},{\vec {y}})\}+\|{\vec {y}}\|^{2}}},

kde $\scriptstyle {\text{Re}}\{({\vec {x}},{\vec {y}})\}$ označuje reálnou část čísla $\scriptstyle ({\vec {x}},{\vec {y}})$ . Tuto můžeme seshora odhadnout absolutní hodnotou téhož čísla, tj. $\scriptstyle {\text{Re}}\{({\vec {x}},{\vec {y}})\}\leq |({\vec {x}},{\vec {y}})|$ . Absolutní hodnotu skalárního součinu můžeme navíc díky Schwarzově nerovnosti odhadnout jako $\scriptstyle |({\vec {x}},{\vec {y}})|\leq \|{\vec {x}}\|\|{\vec {y}}\|$ . Celkově tedy dostáváme výraz

\|{\vec {x}}+{\vec {y}}\|\leq {\sqrt {\|{\vec {x}}\|^{2}+2\|{\vec {x}}\|\|{\vec {y}}\|+\|{\vec {y}}\|^{2}}}={\sqrt {(\|{\vec {x}}\|+\|{\vec {y}}\|)^{2}}}=\|{\vec {x}}\|+\|{\vec {y}}\|,

jenž jsme měli dokázat. Zobrazení definované pomocí skalárního součinu způsobem výše je tedy skutečně norma. Jak vidno, každý prostor se skalárním součinem je současně i normovaným prostorem. Naopak to však platit nemusí. Níže si nicméně uvedeme příklady těch normovaných prostorů, na kterých se navíc dá zavést i skalární součin.

Eukleidův prostor

Vraťme se opět k našemu oblíbenému vektorovému prostoru aritmetických vektorů definovanému nad číselným tělesem. Pro konkrétnost uvažujme prostor $\scriptstyle \mathbb {C} ^{n}$ nad tělesem $\scriptstyle \mathbb {C}$ . Podobně jako v případě normy, tak i v případě skalárního součinu je více možností jak toto zobrazení zavést. My se zde zmíníme o nejčastěji užívaném součinu, standardním skalárním součinu. Ten je dán vztahem

({\vec {x}},{\vec {y}})=\sum _{i=1}^{n}{\bar {x}}_{i}y_{i},

kde $\scriptstyle {\vec {x}}=(x_{1},x_{2},\ldots ,x_{n})$ a $\scriptstyle {\vec {y}}=(y_{1},y_{2},\ldots ,y_{n})$ jsou libovolné dva vektory z $\scriptstyle \mathbb {C} ^{n}$ . Pruh nad složkou vektoru označuje komplexní sdružení daného čísla. Nejprve musíme ověřit, že toto zobrazení, které dvěma vektorům přiřadí obecně komplexní číslo, skutečně splňuje axiomy skalárního součinu a své jméno si tedy zaslouží. Ověření všech náležitostí je ale snadné, máme tak aritmetický vektorový prostor vybavený standardním skalárním součinem. Zaveďme nyní s pomocí tohoto skalárního součinu normu na prostoru $\scriptstyle \mathbb {C} ^{n}$ postupem zmíněným v úvodu nadřazené sekce. Pro libovolný vektor $\scriptstyle {\vec {x}}=(x_{1},x_{2},\ldots ,x_{n})$ tedy dostáváme

\|{\vec {x}}\|={\sqrt {({\vec {x}},{\vec {x}})}}={\sqrt {\sum _{i=1}^{n}{\bar {x}}_{i}x_{i}}}={\sqrt {\sum _{i=1}^{n}|x_{i}|^{2}}}.

Jak vidíme, tato norma je rovna Euklidově normě definované v oddíle Aritmetické prostory. Standardní skalární součin tedy indukuje Euklidovu normu $\scriptstyle \|\cdot \|_{2}$ . Pokud místo komplexních čísel uvažujeme všude reálná čísla, tj. vektorový prostor $\scriptstyle \mathbb {R} ^{n}$ nad tělesem $\scriptstyle \mathbb {R}$ , tak se nám standardní skalární součin redukuje do tvaru

({\vec {x}},{\vec {y}})=\sum _{i=1}^{n}x_{i}y_{i},

kde $\scriptstyle {\vec {x}}=(x_{1},x_{2},\ldots ,x_{n})$ a $\scriptstyle {\vec {y}}=(y_{1},y_{2},\ldots ,y_{n})$ jsou libovolné dva vektory z $\scriptstyle \mathbb {R} ^{n}$ . I tento skalární součin samozřejmě indukuje Euklidovu normu, tentokrát na prostoru $\scriptstyle \mathbb {R} ^{n}$ . Vektorovému prostoru $\scriptstyle \mathbb {R} ^{n}$ nad tělesem $\scriptstyle \mathbb {R}$ s výše definovaným skalárním součinem a odpovídající normou se říká Eukleidův prostor dimenze $\scriptstyle n$ .

l² prostor

Uvažujme nyní l² prostor, tj. l^p prostor definovaný výše, kde položíme p = 2. Tento prostor tvoří konvergentní posloupnosti $\scriptstyle (a_{n})_{n=1}^{\infty }$ komplexních čísel, pro které platí

\sum _{n=1}^{\infty }|a_{n}|^{2}<+\infty .

Protože jsou posloupnosti jistým zobecněním aritmetických vektorů, zaveďme v analogii s předchozím příkladem zobrazení

((a_{n}),(b_{n}))=\sum _{n=1}^{\infty }{\bar {a}}_{n}b_{n},

kde $\scriptstyle (a_{n})$ a $\scriptstyle (b_{n})$ jsou libovolné dvě posloupnosti z prostoru l². O tomto zobrazení bychom chtěli opět ukázat, že se jedná o skalární součin. Jednotlivé vlastnosti skalárního součinu bychom ověřovali podobně jako u aritmetických vektorů, zde ale navíc ještě potřebujeme vědět, zda řada, vystupující v definici zobrazení výše, má konečný součet. V této souvislosti lze užít Hölderovy nerovnosti ve tvaru

\sum _{n=1}^{\infty }|a_{n}b_{n}|\leq \left(\sum _{n=1}^{\infty }|a_{n}|^{2}\right)^{\frac {1}{2}}\left(\sum _{n=1}^{\infty }|b_{n}|^{2}\right)^{\frac {1}{2}}

.

Protože vybíráme posloupnosti s prostoru l², tak jsou řady na pravé straně nerovnosti konečné a číslo na pravé straně je tedy konečné. Z toho plyne, že je konečná i řada na levé straně. Pro tuto řadu ale zjevně platí

\sum _{n=1}^{\infty }{\bar {a}}_{n}b_{n}\leq \sum _{n=1}^{\infty }|a_{n}b_{n}|.

Máme tak ověřeno, že zobrazení výše je skalární součin, který každé dvojici posloupností z prostoru l² přiřazuje (konečné) číslo. Obdobně jako v předchozím příkladu bychom i nyní ověřili, že tento skalární součin definuje normu, která je totožná s normou $\scriptstyle \|\cdot \|_{2}$ definovanou v oddíle l^p prostory, když položíme p=2.

L² prostor

Přejděme nyní od l^p prostorů číselných posloupností k L^p prostorům měřitelných funkcí. Uvažujme konkrétně L² prostor. Tedy množinu měřitelných funkcí definovaných na prostoru s mírou $\scriptstyle (X,\Sigma ,\mu )$ , které splňují vztah

\int _{X}|f|^{2}\,\mathrm {d} \mu <+\infty .

I na tomto prostoru chceme zavést skalární součin. Vyjdeme-li z výrazu pro skalární součin posloupností v předchozím příkladu, kde sumu zaměníme za integrál, tak obdržíme definiční vztah

(f,g)=\int _{X}{\bar {f}}g\,\mathrm {d} \mu ,

kde $\scriptstyle f,g$ jsou libovolné (komplexní) funkce z L². Analogicky jako pro posloupnosti bychom i zde ověřili, že zadaný vztah definuje skalární součin, opět bychom pro ověřování trojúhelníkové nerovnosti využili Hölderovy nerovnosti, tentokrát v integrálním tvaru. A podobně jako v případě posloupností bychom i nyní ukázali, že takto definovaný skalární součin indukuje normu, která je totožná s normou $\scriptstyle \|\cdot \|_{2}$ objevující se v oddíle L^p prostory, když položíme p=2. Vektorovému prostoru L² vybavenému skalárním součinem definovaným výše se říká prostor kvadraticky integrabilních funkcí. Tento prostor hraje zvlášť důležitou roli v kvantové mechanice. Zhruba řečeno, všechny vlnové funkce popisující stav kvantového systému totiž musejí v souladu s Bornovým postulátem patřit do tohoto prostoru.

Topologický vektorový prostor

Dosud jsme si uváděli příklady vektorových prostorů, k nimž byla dodatečná struktura dodána pomocí jistých zobrazení, která vektorům přiřazovala čísla. Na vektorový prostor však můžeme nahlížet i z topologického hlediska. Můžeme ho totiž současně chápat jako topologický prostor s jistou topologií. Zajímavý je pak příklad, kdy je topologie vektorového prostoru spojena s jeho lineární strukturou. Tímto spojením máme na mysli situaci, při níž jsou operace sčítání vektorů a násobení vektoru prvkem z tělesa v dané topologii spojitými zobrazeními. Dospíváme tak k objektu nazvanému topologický vektorový prostor, jehož matematickou definici uvádíme v následujícím.

Vektorový prostor $\scriptstyle V$ nad tělesem $\scriptstyle T$ vybavený topologií $\scriptstyle \tau$ tvoří topologický vektorový prostor, právě když jsou splněny tři podmínky:

Sčítání vektorů $\scriptstyle \oplus$ , chápané jako zobrazení topologických prostorů ${\displaystyle \scriptstyle \oplus$ , je spojité zobrazení.
Násobení prvkem z tělesa $\scriptstyle \odot$ , chápané jako zobrazení topologických prostorů ${\displaystyle \scriptstyle \odot$ , je spojité zobrazení.
Prostor $\scriptstyle (V,\tau )$ je Hausdorffův.

Předpokládáme přitom, že na tělese $\scriptstyle T$ je též zavedena jistá topologie. Topologie $\scriptstyle \tau '$ v první podmínce představuje součinovou topologii na kartézském součinu $\scriptstyle V\times V$ , topologie $\scriptstyle \tau ''$ ve druhé podmínce pak součinovou topologii na kartézském součinu $\scriptstyle T\times V$ . Poslední požadavek pak nakládá omezení na vzhled topologie $\scriptstyle \tau$ vektorového prostoru $\scriptstyle V$ . Sice, že pro každé dva vektory existují jejich okolí, která jsou navzájem disjunktní. Ne každý vektorový prostor, na němž je definována topologie, tedy musí být nutně topologickým vektorovým prostorem.

Topologický vektorový prostor aritmetických vektorů

Jednoduchým příkladem topologického vektorového prostoru je prostor aritmetických vektorů $\scriptstyle V=\mathbb {R} ^{n}$ , kde za topologii vezmeme topologii indukovanou euklidovskou normou. Jinými slovy, okolími daného vektoru jsou koule o jistém poloměru mající svůj střed v tomto vektoru. Tedy například (otevřená) koule $\scriptstyle B_{r}^{n}({\vec {x}})$ o (kladném) poloměru $\scriptstyle r$ se středem ve vektoru $\scriptstyle {\vec {x}}=(x_{1},x_{2},\ldots ,x_{n})$ má množinový tvar

B_{r}^{n}({\vec {x}})=\{{\vec {y}}\in \mathbb {R} ^{n}|\|{\vec {y}}-{\vec {x}}\|_{2}<r\}={\Bigg \{}{\vec {y}}=(y_{1},y_{2},\ldots ,y_{n})\in \mathbb {R} ^{n}{\Bigg |}{\sqrt {\sum _{i=1}^{n}(y_{i}-x_{i})^{2}}}\ <\ r{\Bigg \}}.

Topologii pak sestrojíme jako sjednocení všech možných koulí, tj. koulí o všech možných (nenulových) poloměrech se středy ve všech možných vektorech prostoru $\scriptstyle \mathbb {R} ^{n}$ . K nim ještě musíme do topologie přihodit všechny možné průniky konečně mnoha libovolných koulí, prázdnou množinu a celou množinu $\scriptstyle \mathbb {R} ^{n}$ . Za těleso bereme reálnou osu $\scriptstyle \mathbb {R}$ , jehož topologii sestrojíme analogicky případu výše, kde položíme $\scriptstyle n=1$ . V takovém případě se nám otevřená koule redukuje na otevřený interval

B_{r}^{1}(x)=\{y\in \mathbb {R} ||y-x|<r\}=(x-r,x+r).

Součinová topologie $\scriptstyle \tau ''$ pro kartézský součin $\scriptstyle T\times V$ je pak tvořena kartézskými součiny koulí z prostorů $\scriptstyle T=\mathbb {R}$ a $\scriptstyle V=\mathbb {R} ^{n}$ , jejich konečnými průniky a libovolnými sjednoceními, kde navíc vezmeme ještě prázdnou množinu a celou množinu $\scriptstyle T\times V$ . Podobně pro topologii $\scriptstyle \tau '$ na kartézském součinu $\scriptstyle V\times V$ .

Ukažme nejprve spojitost součtu dvou aritmetických vektorů v námi zavedené topologii. Naším úkolem je ověřit, že pro kterékoliv dva vektory $\scriptstyle {\vec {x}}_{0}$ a $\scriptstyle {\vec {y}}_{0}$ a kterýkoli kladný poloměr $\scriptstyle r$ leží vektor tvaru $\scriptstyle {\vec {x}}+{\vec {y}}$ v okolí $\scriptstyle U=B_{r}^{n}({\vec {x}}_{0}+{\vec {y}}_{0})$ , kde $\scriptstyle {\vec {x}}\in B_{\varepsilon }^{n}({\vec {x}}_{0})$ a $\scriptstyle {\vec {y}}\in B_{\tilde {\varepsilon }}^{n}({\vec {y}}_{0})$ pro jisté poloměry $\scriptstyle \varepsilon$ a $\scriptstyle {\tilde {\varepsilon }}$ . Neboli chceme, aby platilo $\scriptstyle \|({\vec {x}}+{\vec {y}})-({\vec {x}}_{0}+{\vec {y}}_{0})\|_{2}<r$ . Pokud pro každé $\scriptstyle r$ najdeme odpovídající $\scriptstyle \varepsilon$ a $\scriptstyle {\tilde {\varepsilon }}$ tak, aby byla splněna tato podmínka, tak můžeme uzavřít, že sčítání vektorů je spojité, neboť pro každé okolí $\scriptstyle U$ součtu jsme našli odpovídající okolí $\scriptstyle B_{\varepsilon }^{n}({\vec {x}}_{0})\times B_{\tilde {\varepsilon }}^{n}({\vec {y}}_{0})$ v součinové topologii množiny $\scriptstyle V\times V$ , které vystupuje v definici spojitosti. Za tím účelem však stačí položit $\scriptstyle \varepsilon ={\tilde {\varepsilon }}={\frac {r}{3}}$ , abychom měli

\|({\vec {x}}+{\vec {y}})-({\vec {x}}_{0}+{\vec {y}}_{0})\|_{2}=\|({\vec {x}}-{\vec {x}}_{0})+({\vec {y}}+{\vec {y}}_{0})\|_{2}\leq \|{\vec {x}}-{\vec {x}}_{0}\|_{2}+\|{\vec {y}}+{\vec {y}}_{0}\|_{2}<\varepsilon +{\tilde {\varepsilon }}={\frac {r}{3}}+{\frac {r}{3}}={\frac {2r}{3}}<r.

Odhadli jsme tedy patřičnou normu jak jsme měli a ověřili jsme tak spojitost sčítání vektorů.

Podobně nyní ověřme spojitost násobení vektoru číslem. Chceme ukázat, že pro každý násobek $\scriptstyle \alpha _{0}{\vec {x}}_{0}$ čísla $\scriptstyle \alpha _{0}$ a vektoru $\scriptstyle {\vec {x}}_{0}$ a pro každé jeho okolí $\scriptstyle U=B^{n}(\alpha _{0}{\vec {x}}_{0})$ najdeme okolí $\scriptstyle B^{1}(\alpha _{0})$ čísla $\scriptstyle \alpha _{0}$ a okolí $\scriptstyle B^{n}({\vec {x}}_{0})$ vektoru $\scriptstyle {\vec {x}}_{0}$ tak, že ať vynásobím libovolné číslo z okolí $\scriptstyle B^{1}(\alpha _{0})$ s libovolným vektorem z okolí $\scriptstyle B^{n}({\vec {x}}_{0})$ , tak dostanu opět vektor, který leží v okolí $\scriptstyle U$ . Jinými slovy, mějme kouli $\scriptstyle U=B_{r}^{n}(\alpha _{0}{\vec {x}}_{0})$ se středem v $\scriptstyle \alpha _{0}{\vec {x}}_{0}$ a poloměrem $\scriptstyle r$ . Chceme najít poloměr $\scriptstyle \varepsilon$ koule $\scriptstyle B_{\varepsilon }^{1}(\alpha _{0})$ se středem v $\scriptstyle \alpha _{0}$ a poloměr $\scriptstyle {\tilde {\varepsilon }}$ koule $\scriptstyle B_{\tilde {\varepsilon }}^{n}({\vec {x}}_{0})$ se středem v $\scriptstyle {\vec {x}}_{0}$ tak, aby libovolný vektor tvaru $\scriptstyle \alpha {\vec {x}}$ ležel v množině $\scriptstyle U$ , kde $\scriptstyle \alpha \in B_{\varepsilon }^{1}(\alpha _{0})$ a $\scriptstyle {\vec {x}}\in B_{\tilde {\varepsilon }}^{n}({\vec {x}}_{0})$ . S použitím vlastností normy můžeme odhadnout seshora výraz $\scriptstyle \|\alpha {\vec {x}}-\alpha _{0}{\vec {x}}_{0}\|_{2}$ následovně

\|\alpha {\vec {x}}-\alpha _{0}{\vec {x}}_{0}\|_{2}=\|(\alpha -\alpha _{0})({\vec {x}}-{\vec {x}}_{0})+\alpha _{0}({\vec {x}}-{\vec {x}}_{0})+(\alpha -\alpha _{0}){\vec {x}}_{0}\|_{2}\ \leq \ |\alpha -\alpha _{0}|\|{\vec {x}}-{\vec {x}}_{0}\|_{2}+|\alpha _{0}|\|{\vec {x}}-{\vec {x}}_{0}\|_{2}+|\alpha -\alpha _{0}|\|{\vec {x}}_{0}\|_{2}\ \leq \ \varepsilon {\tilde {\varepsilon }}+|\alpha _{0}|{\tilde {\varepsilon }}+\varepsilon \|{\vec {x}}_{0}\|_{2},

kde jsme ve druhé nerovnosti využili definic příslušných okolí, jak jsou specifikována výše. Diskutujme nyní dva případy. Za prvé, když platí $\scriptstyle r\ \geq \ 6\|\alpha _{0}{\vec {x}}_{0}\|_{2}$ , kde $\scriptstyle r$ je poloměr okolí $\scriptstyle U$ . V takovém případě stačí položit $\scriptstyle \varepsilon =|\alpha _{0}|$ a $\scriptstyle {\tilde {\varepsilon }}=\|{\vec {x}}_{0}\|_{2}$ , abychom obdrželi

\varepsilon {\tilde {\varepsilon }}+|\alpha _{0}|{\tilde {\varepsilon }}+\varepsilon \|{\vec {x}}_{0}\|_{2}=3|\alpha _{0}|\|{\vec {x}}_{0}\|_{2}\leq 6|\alpha _{0}|\|{\vec {x}}_{0}\|_{2}\leq r.

Ukázali jsme tedy, že pokud $\scriptstyle r\ \geq \ 6\|\alpha _{0}{\vec {x}}_{0}\|_{2}$ , tak jsme našli poloměry okolí $\scriptstyle B_{\varepsilon }^{1}(\alpha _{0})$ a $\scriptstyle B_{\tilde {\varepsilon }}^{n}({\vec {x}}_{0})$ tak, že vyhovují definici spojitosti násobení vektoru číslem. Podívejme se nyní na případ, kdy $\scriptstyle r\ <\ 6\|\alpha _{0}{\vec {x}}_{0}\|_{2}$ . Tehdy můžeme položit

\varepsilon ={\frac {r}{6\|{\vec {x}}_{0}\|_{2}}},\quad {\tilde {\varepsilon }}={\frac {r}{6|\alpha _{0}|}},

kde $\scriptstyle r$ je poloměr okolí $\scriptstyle U$ . Dostáváme tak

\varepsilon {\tilde {\varepsilon }}+|\alpha _{0}|{\tilde {\varepsilon }}+\varepsilon \|{\vec {x}}_{0}\|_{2}={\frac {r^{2}}{36|\alpha _{0}|\|{\vec {x}}_{0}\|_{2}}}+{\frac {r}{6}}+{\frac {r}{6}}={\frac {r}{6}}\,{\Bigg (}{\frac {r}{6\|\alpha _{0}{\vec {x}}_{0}\|_{2}}}+2{\Bigg )}.

Protože řešíme případ pro $\scriptstyle r\ <\ 6\|\alpha _{0}{\vec {x}}_{0}\|_{2}$ , můžeme první člen v závorce odhadnou seshora jedničkou, abychom dostali výraz

{\frac {r}{6}}\,{\Bigg (}{\frac {r}{6\|\alpha _{0}{\vec {x}}_{0}\|_{2}}}+2{\Bigg )}<{\frac {r}{6}}\,{\Bigg (}1+2{\Bigg )}={\frac {r}{2}}<r.

V případě $\scriptstyle r\ <\ 6\|\alpha _{0}{\vec {x}}_{0}\|_{2}$ jsme tedy též našli poloměry $\scriptstyle \varepsilon ,{\tilde {\varepsilon }}$ daných okolí tak, že je splněna podmínka spojitosti. Ověřili jsme tak platnost druhé definiční podmínky topologického vektorového prostoru.

Prostor $\scriptstyle V=\mathbb {R} ^{n}$ je zajisté Hausdorffův, protože pro každé dva vektory $\scriptstyle {\vec {x}},{\vec {y}}$ jsme schopni zjistit jejich vzdálenost pomocí Euklidovy normy, označme si ji $\scriptstyle d$ . Když pak vezmu kouli $\scriptstyle B_{r}({\vec {x}})$ o poloměru $\scriptstyle r={\frac {d}{3}}$ a kouli $\scriptstyle B_{r}({\vec {y}})$ o témže poloměru, tak tyto dvě koule tvoří okolí vektoru $\scriptstyle {\vec {x}}$ a vektoru $\scriptstyle {\vec {y}}$ a jsou přitom disjunktní. Je tedy splněn i třetí požadavek a můžeme uzavřít, že prostor $\scriptstyle V=\mathbb {R} ^{n}$ nad tělesem $\scriptstyle T=\mathbb {R}$ s přirozeně zavedenou topologií je topologickým vektorovým prostorem.

Vektorové prostory nad konečným tělesem

Zdaleka nejčastěji používanými vektorovými prostory jsou ty definované nad tělesem reálných či komplexních čísel. Lze však uvažovat i jiná než tato tělesa, která ani nemusí mít nekonečnou mohutnost. Zvláštním případem vektorového prostoru je vektorový prostor definovaný nad konečným tělesem.

Konečná tělesa jsou často využívána např. v informatice v teorii kódování (lineární kódy). V tomto oboru se nejčastěji (pokud ne pouze) využívá tělesa Z₂.

Aplikace

Použití ve fyzice

Již před zavedením pojmu vektorového prostoru se objevil koncept vektoru ve fyzice, kde se s jeho pomocí popisuje působení sil, momentů sil a dalších veličin, pro jejichž určení je důležitá nejen jejich velikost, ale i směr působení. Vektor samotný pak obvykle vyjadřujeme jako šipku, jejíž směr udává směr působení a její délka velikost působící veličiny. Více se o tomto tématu zmiňuje článek Vektor.

Jistým zobecněním vektoru je pojem tenzoru. Ten lze vyjádřit pomocí dvourozměrného lineárního objektu – matice. Příkladem může být např. tenzor momentu setrvačnosti, tenzor elektromagnetického pole atd. S tenzory se lze setkat kromě mechaniky např. i v obecné teorii relativity.

S dalším příkladem využití vektorového prostoru se můžeme hojně setkat v kvantové mechanice, kde se s jeho pomocí popisuje stav částice či jiného fyzikálního systému. V této souvislosti velkého významu nabývají tzv. L^p prostory integrabilních funkcí. Fyzikální stav systému lze popsat jako komplexní funkci, kterou lze opět chápat jako vektor. Fyzikální veličiny jsou pak v souladu s axiomy kvantové mechaniky vyjádřeny jako lineární operátory působící na těchto vektorech.

Značná obliba lineárních objektů ve fyzice vyvěrá z faktu, že k popisu přírodních procesů se dosti často používají rovnice, které jsou obtížně řešitelné. Pokud se namísto s přesným analytickým řešením spokojíme s alespoň přibližným řešením (často nám kvůli obtížnosti úlohy ani nic jiného nezbývá), tak nejjednodušším možným způsobem je předpokládat, že řešením je lineární objekt. Ten dosadíme do rovnice popisující přírodní proces a snažíme se najít takový tvar lineárního objektu, aby byla vzniklá odchylka od přesného řešení minimální. Tato metoda nalezení přibližného řešení funguje překvapivě často. Lineární objekty mají tu výhodu, že se s nimi snadno pracuje a je pro ně vybudována rozsáhlá matematická teorie. V kvantové mechanice se dokonce lineární struktura fyzikálního světa rovnou předpokládá a je ukotvena v axiomech kvantové mechaniky.

Použití v matematice

Kromě fyziky zaujímá pojem vektorového prostoru či obecněji lineární algebry jako celku nezastupitelné místo třeba v oblasti numerické matematiky či informatiky. Lineární algebra poskytuje rámec, ve kterém je možno různé výpočetní problémy formulovat elegantním a přehledným způsobem. Zejména teorie matic nalézá v numerické matematice široké uplatnění. Koncept vektorového prostoru je možno nalézt i v teoretičtějších partiích matematiky. Příkladem za všechny může být tečný prostor zavedený na fibrovaném prostoru, což je struktura studovaná odvětvím diferenciální geometrie.

Odkazy

Reference

BALKOVÁ, Ľubomíra. Lineární algebra 1. Praha: Česká technika - nakladatelství ČVUT, 2013. ISBN 978-80-01-05346-1. – skripta FJFI ČVUT

Související články

Externí odkazy

Obrázky, zvuky či videa k tématu vektorový prostor na Wikimedia Commons
Vektorový prostor v encyklopedii MathWorld (anglicky)

Literatura

PYTLÍČEK, Jiří. Lineární algebra a geometrie. Praha: Česká technika - nakladatelství ČVUT, 2008. ISBN 978-80-01-04063-8. – skripta FJFI ČVUT

BALKOVÁ, Ľubomíra. Lineární algebra 1. Praha: Česká technika - nakladatelství ČVUT, 2013. ISBN 978-80-01-05346-1. – skripta FJFI ČVUT

BLANK, Jiří; EXNER, Pavel; HAVLÍČEK, Miloslav. Lineární operátory v kvantové fyzice. Praha: Karolinum, 1993. ISBN 80-7066-586-6.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[Balkova-1] BALKOVÁ, Ľubomíra. Lineární algebra 1. Praha: Česká technika - nakladatelství ČVUT, 2013. ISBN 978-80-01-05346-1. – skripta FJFI ČVUT

Vektorový prostor

Historie

Motivace

Fyzikální vektory

Polynomy jako vektory

Společné vlastnosti

Definice

Obecné vlastnosti

Vektorové operace s množinami

Základní pojmy

Lineární kombinace

Lineární nezávislost

Dimenze

Báze

Vektorový podprostor

Lineární obal

Příklady vektorových prostorů

Aritmetické vektory

Matice

Lineární operátory

Posloupnosti

Spojité funkce

Polynomy

Vektorové prostory s dodatečnou strukturou

Normované vektorové prostory

Aritmetické prostory

Prostory matic

Prostory lineárních operátorů

lp prostory

Lp prostory

Prostory se skalárním součinem

Eukleidův prostor

l2 prostor

L2 prostor

Topologický vektorový prostor

Topologický vektorový prostor aritmetických vektorů

Vektorové prostory nad konečným tělesem

Aplikace

Použití ve fyzice

Použití v matematice

Odkazy

Reference

Související články

Externí odkazy

Literatura

l^p prostory

L^p prostory

l² prostor

L² prostor