Metoda Lagrangeových multiplikátorů
Metoda Lagrangeových multiplikátorů neboli Lagrangeova metoda neurčitých koeficientů je metoda, jak nalézt extrémy diferencovatelné funkce za předpokladu platnosti diferencovatelných omezujících podmínek. Uveřejnil ji Joseph-Louis Lagrange počátkem 19. století.
Jestliže hledáme extrémy funkce za předpokladu platnosti m vazeb (omezujících podmínek) ve tvaru
kde n a k jsou přirozená čísla a k nabývá hodnot mezi 1 a m, tak metoda Lagrangeových multiplikátorů začíná vytvořením Lagrangeovy funkce , závislé na n + m proměnných:
Kromě původních proměnných tedy zavádíme další neznámé , zvané Lagrangeovy multiplikátory. Nyní platí, že pokud se hledaný vázaný extrém nalézá v bodě, kde jsou všechny zkoumané funkce diferencovatelné, pak tento bod splňuje kromě m vazebných rovnic uvedených výše také n rovnic tvaru
což je totéž jako
Tím získáme soustavu n + m rovnic pro n + m proměnných, jejímž řešením najdeme potenciální extrémy. Pak je potřeba vyšetřit, zda se jedná o maxima, minima nebo sedlové body. V případě, že zúčastněné funkce vykazují nediferencovatelné body, je potřeba zvlášť vyšetřit i tyto, neboť i zde se mohou hledané extrémy nacházet.
Poněvadž m vazebných podmínek lze získat tím, že Lagrangeovu funkci parciálně zderivujeme podle multiplikátorů a derivace položíme rovny nule, lze souhrnně říci, že nutnou podmínkou existence vázaného extrému za podmínek diferencovatelnosti v daném bodě je, aby gradient Lagrangeovy funkce v tomto bodě vymizel, což lze vektorově zapsat jako:
což znamená, že Lagrangeovu funkci je potřeba postupně zderivovat podle všech jejích n + m proměnných, derivace položit rovny nule a soustavu vyřešit. Řešení udávají souřadnice bodů, v nichž může (ale nemusí) existovat hledaný vázaný extrém.
Příklad
Najděme maximum lineární funkce vázané na jednotkovou kružnici .
Vazba je
takže Lagrangeova funkce je
Derivací Lagrangeovy funkce podle jednotlivých proměnných získáme gradient:
a jeho položením rovna nule dostaneme soustavu tří rovnic pro tři neznámé proměnné:
Poslední rovnice je vazba, z prvních dvou rovnic dostaneme
Dosazením do poslední rovnice máme
takže
což po dopočítání x a y vede k závěru, že řešení (stacionární body ) jsou
Vypočítáme hodnoty f v těchto bodech (zajímají nás jen první dvě souřadnice stacionárních bodů, třetí souřadnice odpovídá multiplikátoru, který v tuto chvíli už nepotřebujeme):
Vázané maximum tedy je a vázané minimum .
Geometrický význam
Ve dvourozměrném případě na obrázcích je naznačena funkce f a její vrstevnice f(x, y) = 0, jakož i křivka g(x, y) = 0 odpovídající vazbě. Hledáme nejvyšší hodnotu f, která se nachází na bodech této červeně vyznačené křivky (tj. vázaný extrém).
Vázaný extrém se může vyskytnout pouze na vrstevnici, kterou křivka vazby neprotíná. Jinak totiž se na jedné straně od takové vrstevnice nacházejí hodnoty vyšší a na druhé straně nižší než f(x, y), a proto zde nemůže nastat extrém; postupem po křivce vazby se totiž hned v sousedství daného bodu dostaneme na hodnoty vyšší nebo nižší než v tomto bodě.
Pokud se vrstevnice a křivka vazby neprotínají, musejí se dotýkat (být si lokálně tečnami). Stačí tedy analyticky vyjádřit, že se dvě křivky dotýkají, a máme nutnou podmínku vázaného extrému. K tomu účelu si uvědomme, že „lokální směr“ přímky nebo plochy určuje gradient – vektor, mířící ve směru největšího zakřivení, a tedy kolmý na tečnu. Na nižším obrázku jsou gradienty naznačeny jako malé šipky vycházející z křivek.
Protože tečny jsou stejné, musejí být až na měřítko shodné i gradienty – musejí mířit stejným (anebo přesně opačným) směrem. Existuje tedy nenulová konstanta tak, že v bodě dotyku (x, y) platí
neboli
kde je gradient v tomto bodě a je gradient tamtéž. Souřadnice gradientů dostaneme jako parciální derivace příslušných funkcí podle jednotlivých souřadnic, což umožní uvedenou vektorovou rovnici rozepsat po souřadnicích:
Pokud k těmto dvěma rovnicím připojíme ještě třetí, vazební rovnici g(x, y) = 0, dostaneme přesně totéž, co bychom získali parciálním derivováním příslušné Lagrangeovy funkce
podle všech tří jejích argumentů a položením jednotlivých derivací rovných nule.
Tato úvaha není důkazem v přísném smyslu, protože se opírá o geometrickou intuici a neřeší různé zvláštní případy (zejména co se stane, když některý z gradientů vymizí – je roven nulovému vektoru). Lze ji však snadno zobecnit na více proměnných a vazeb, a odůvodnit tak obecnou Lagrangeovu metodu.