Simulované žíhání

Simulované žíhání (simulované ochlazování, anglicky Simulated annealing, SA) je pravděpodobnostní optimalizační metoda prohledávání stavového prostoru založená na simulaci žíhání oceli. Při prohledávání stavového prostoru se může snadno stát, že algoritmus uvázne v lokálním minimu. V metodě se tomu snažíme zabránit tím, že provádíme i změny k horšímu, velké hlavně zpočátku, a díky tomu se můžeme dostat z lokálního minima. Velikost změny záleží na teplotě. Čím větší je teplota, tím větší se provádí změny. Algoritmus pracuje pouze s jedním kandidátním řešením. Obyčejný gradientní algoritmus přijímá nové řešení, pouze pokud je lepší než řešení stávající. Při simulovaném žíhání jsou s určitou pravděpodobností přijímána i řešení horší. Pravděpodobnost přijetí i horšího řešení je přímo závislá na teplotě a nepřímo na velikosti zhoršení. V průběhu výpočtu algoritmu je teplota postupně snižována na základě rychlosti konvergence (přibližování se cíli). Pokud algoritmus konverguje rychle (hodnocení stavů rychle klesá), snižuje se teplota také rychle a algoritmu je tak bráněno pokračovat do hůře hodnoceného stavu. Konverguje-li algoritmus pomalu (hodnocení stavů moc neklesá), zpomalí se snižování teploty, aby se případně podařilo vyprostit z lokálního minima.

Pokud nejsme spokojeni s výsledkem, tak teplotu lze i zvyšovat. Potom pravděpodobnost, že bude algoritmus pokračovat do hůře hodnoceného stavu také stoupá, jestliže se algoritmu nedaří (neustálým pokračováním do co nejlépe hodnocených stavů) přibližovat se cíli.

Algoritmus nezaručuje nalezení globálního minima. Pro zlepšení výsledků algoritmus můžeme pustit několikrát z různých, například náhodných, počátečních stavů.

Přehled

Termodynamický stav některých fyzikálních systémů $s$ a funkce E(s), která má být minimalizována, je analogická s vnitřní energií systému v tomto stavu. Cílem je převést systém z libovolného "počátečního stavu“ do stavu s minimální možnou energií.

Simulované žíhání hledající maximum. Cílem je dosáhnout nejvyššího bodu; nestačí však použít jednoduchý gradientní algoritmus, jelikož je mnoho lokálních maxim. Pomalým ochlazením teploty je nalezeno globální maximum.

Základní iterace

V každém kroku simulovaná žíhací heuristika bere v úvahu některý sousední stav současného stavu a spojenec se rozhoduje mezi přesunem systému do stavu ve stavu "s“. Tyto pravděpodobnostní nakonec vedou systém k přechodu do stavu s nižší energií. Tento krok se obvykle opakuje, dokud systém nedosáhne stavu, který je pro aplikaci dostatečně dobrý, nebo dokud není vyčerpán daný výpočetní rozpočet.

Sousedé stavu

Optimalizace řešení zahrnuje problému hodnocení stavů sousedů, což jsou nové stavy produkované konzervativní změnou daného stavu. Například v problému obchodního cestujícího je každý stav obvykle definován jako permutace měst, která mají být navštívena, a sousedé jakéhokoli stavu jsou množinou permutací vytvořených prohozením jakýchkoli dvou z těchto měst. Dobře definovaný způsob, jakým jsou stavy prohazovány, aby vytvářely sousední stavy, se nazývá "tah“ a různé pohyby poskytují různé sady sousedních stavů. Tyto kroky obvykle vedou k minimálním změnám posledního stavu, ve snaze o postupné vylepšování řešení iterativním vylepšováním jeho částí (například městská spojení v problému obchodního cestujícího).

Jednoduché heuristické typy jako gradientní algoritmus, které se pohybují hledáním lepšího souseda za lepším sousedem a zastaví se, když dosáhnou řešení, které nemá lepší sousedy, nemohou zaručit, že povedou k některému ze stávajících lepší řešení jejich výsledkem může být jednoduše jen lokální optimum, zatímco nejlepším řešením by bylo globální optimum, které by se mohlo lišit. Metaheuristiky používají sousedy řešení jako způsob, jak prozkoumat prostor řešení, a přestože dávají přednost lepším sousedům, přijímají také horší sousedy, aby se vyhnuli uvíznutí v místních optimech; mohou najít globální optimum, pokud běží dostatečně dlouho.

Pravděpodobnosti přijetí

Pravděpodobnost uskutečnění změny stavu z aktuálního stavu $s$ do kandidátního nového stavu $s_{\mathrm {new} }$ je určena potvrzením pravděpodobnostní funkce $P(e,e_{\mathrm {new} },T)$ , která závisí na energiích $e=E(s)$ a $e_{\mathrm {new} }=E(s_{\mathrm {new} })$ obou stavů a na globálním časově proměnném parametru $T$ , který se nazývá "teplota“. Stavy s menší energií jsou lepší než stavy s vyšší energií. Pravděpodobnostní funkce $P$ musí být kladná, i když $e_{\mathrm {new} }$ je větší než $e$ . Tato funkce brání tomu, aby se metoda zasekla na místním minimu, které je horší než globální.

Když má $T$ tendenci k nule, pravděpodobnost $P(e,e_{\mathrm {new} },T)$ musí mít tendenci k nule pokud $e_{\mathrm {new} }>e$ a v opačném případě na kladnou hodnotu. U dostatečně malých hodnot $T$ pak systém bude stále více upřednostňovat pohyby, které vedou "z kopce“ (tj. K nižším energetickým hodnotám), a vyhnout se těm, které jdou "do kopce“. U $T=0$ se postup redukuje na Hladový algoritmus, který dělá pouze přechody z kopce.

V původním popisu simulovaného žíhání byla pravděpodobnost $P(e,e_{\mathrm {new} },T)$ rovna 1, když $e_{\mathrm {new} }<e$ ,neboli procedůra se vždy, pokud mohla, pohnula z kopce, bez ohledu na teplotu. Mnoho popisů a implementací simulovaného žíhání stále bere tuto podmínku jako součást definice metody. Tato podmínka není pro fungování metody nezbytná.

Funkce $P$ se obvykle volí tak, aby se pravděpodobnost přijetí tahu snížila, když rozdíl $e_{\mathrm {new} }-e$ se zvyšuje, neboli malé pohyby do kopce jsou pravděpodobnější než velké. Tento požadavek však není nezbytně nutný, pokud jsou splněny výše uvedené požadavky.

Vzhledem k těmto vlastnostem hraje teplota $T$ rozhodující roli při řízení vývoje stavu systému s ohledem na jeho citlivost na variace energií systému. Přesněji řečeno, u velkého $s$ je vývoj $s$ citlivý na hrubší variace energie, zatímco je citlivý na jemnější variace energie, když $T$ je malý.

Plán žíhání

Rychlé

Pomalé

Příklad ilustrující vliv plánu chlazení na výkon simulovaného žíhání. Problémem je změnit uspořádání pixelů v obrazu tak, aby se minimalizovala určitá funkce potenciální energie, což způsobí, že podobné barvy přitahují na krátkou vzdálenost a odpuzují na mírně větší vzdálenost . Elementární pohyby vymění dva sousední pixely. Tyto snímky byly získány s rychlým plánem chlazení (vlevo) a plánem pomalého chlazení (vpravo), čímž byly získány výsledky podobné amorfním a kristalickým strukturám.

Název a inspirace algoritmu vyžadují zajímavou vlastnost související s kolísáním teploty, která má být vložena do provozních charakteristik algoritmu. To vyžaduje postupné snižování teploty v průběhu simulace. Algoritmus začíná zpočátku $T$ nastaveným na vysokou hodnotu (nebo nekonečno) a poté se v každém kroku snižuje po nějakém "žíhacím plánu“, který může uživatel určit, ale musí končít na $T=0$ na konci přiděleného časového rozpočtu. Tímto způsobem se očekává, že se systém bude pohybovat zpočátku směrem k široké oblasti vyhledávacího prostoru obsahující dobré řešení, ignorující malé rysy energetické funkce; pak směřovat k nízkoenergetickým regionům, které se zužují a zužují; a nakonec se pohybovat z kopce podle heuristiky gradientního sestupu.

Pro jakýkoli daný konečný problém se pravděpodobnost, že simulovaný algoritmus žíhání končí řešením globalní optimum, blíží 1, protože se rozvrh žíhání prodlužuje. [1] This theoretical result, however, is not particularly helpful, since the time required to ensure a significant probability of success will usually exceed the time required for a řešení hrubou silou of the prostorů řešení.

Pseudokód

Následující pseudokód představuje simulovanou žíhací heuristiku, jak je popsáno výše. Začíná to od stavu $s 0$ a pokračuje až do maximálně $k max$ kroků. V tomto procesu by volání $Soused('s'))$ mělo generovat náhodně vybraného souseda daného státu $s$ ; volání $Random(0,1)$ by mělo vybrat a vrátit hodnotu v rozsahu $[0,1]$ , rovnoměrného rozdělení. Časový plán žíhání je definován voláním $teplota(r)$ , které by mělo vrátit použitou teplotu, s ohledem na zlomek $r$ časového rozpočtu, který byl zatím vyčerpán.

Výběr parametrů

Aby bylo možné použít metodu simulovaného žíhání na konkrétní problém, je třeba zadat následující parametry: stavový prostor, energetickou (cílovou) funkci E(), postup generátoru kandidáta soused(), funkce pravděpodobnosti přijetí P() a plán žíhání teplota() A počáteční teplota <počáteční teplota>. Tyto volby mohou mít významný dopad na efektivitu metody. Bohužel neexistují žádné volby těchto parametrů, které by byly dobré pro všechny problémy, a neexistuje žádný obecný způsob, jak najít nejlepší možnosti pro daný problém. V následujících částech je uvedeno několik obecných pokynů.

Dostatečně blízko souseda

Simulované žíhání lze modelovat jako náhodný průchod po vyhledávacím grafu, jehož vrcholy jsou všechny možné stavy a jejichž hrany jsou kandidátní pohyby. Základním požadavkem na funkci Neighbor() je, že musí na tomto grafu poskytovat dostatečně krátkou cestu od počátečního stavu do jakéhokoli stavu, který může být globálním optimem průměr hledání graf musí být malý. Ve výše uvedeném příkladu obchodního cestujícího má například vyhledávací prostor pro $n=20$ měst $n!=2432902008176640000$ (2,4 kvintilionu) stavů; počet sousedů každého vrcholu je $\sum _{k=1}^{n-1}k={\frac {n(n-1)}{2}}=190$ hran a průměr grafu je $n-1$ .

Pravděpodobnosti přechodu

Pro zkoumání chování simulovaného žíhání u konkrétního problému může být užitečné vzít v úvahu "pravděpodobnosti přechodu“, které vyplývají z různých konstrukčních možností provedených při implementaci algoritmu. Pro každou hranu $(s,s')$ vyhledávacího grafu je pravděpodobnost přechodu definována jako pravděpodobnost, že se simulovaný žíhací algoritmus přesune do stavu $s'$ , když je jeho aktuální stav $s$ . Tato pravděpodobnost závisí na aktuální teplotě zadané funkcí teplota(), na pořadí, ve kterém se pohyby kandidátů generují pomocí funkce Neighbor(), a na funkci pravděpodobnosti přijetí P(). (Všimněte si, že pravděpodobnost přechodu není "jednoduše“ $P(e,e',T)$ , protože kandidáti jsou testováni sériově.)

Pravděpodobnosti přijetí

Specifikace Neighbor(), P() a temperature() je částečně nadbytečná. V praxi je běžné použít pro mnoho problémů stejnou funkci přijetí P() a upravit další dvě funkce podle konkrétního problému.

Metoda formulovaná Kirkpatrick et al. Byla funkce pravděpodobnosti přijetí <(e,e',T) definována jako 1, pokud $e'<e$ a $\exp(-(e'-e)/T)$ jinak. Tento vzorec byl povrchně ospravedlněn analogií s přechody fyzikálního systému; odpovídá Metropolisův–Hastingsův algoritmus, v případě, že $T=1$ a návrhové rozdělení Metropolis–Hastings je symetrické. Tato pravděpodobnost přijetí se však často používá pro simulované žíhání, i když funkce Neighbor(), která je analogická distribuci návrhů v Metropolis–Hastings, není symetrická nebo vůbec není pravděpodobná. Výsledkem je, že pravděpodobnosti přechodu algoritmu simulovaného žíhání neodpovídají přechodům analogického fyzikálního systému a dlouhodobé rozdělení stavů při konstantní teplotě nemusí být nijak podobné distribuci termodynamické rovnováhy ve stavech fyzikálního systému při jakékoli teplotě. Většina popisů simulovaného žíhání nicméně předpokládá původní akceptační funkci, která je pravděpodobně zakódována v mnoha implementacích SA.

Roku 1990, Moscato and Fontanari [2] and independently Dueck and Scheuer,[3] navrhl, aby deterministická aktualizace (tj. ta, která není založena na pravidlu pravděpodobnosti přijetí), mohla urychlit proces optimalizace, aniž by to mělo dopad na konečnou kvalitu. Moscato a Fontanari docházejí k závěru z pozorování analogie křivky "měrného tepla“ žíhání "aktualizace prahové hodnoty“ pocházející z jejich studie, že „stochasticita aktualizace Metropolis v simulovaném žíhacím algoritmu nehraje při hledání blízké -optimální minima ". Místo toho navrhli, že „vyhlazení prostředí nákladové funkce při vysoké teplotě a postupné definování minim během procesu chlazení jsou základními ingrediencemi pro úspěch simulovaného žíhání.“ Metoda se následně popularizovala pod označením "akceptování prahu“ kvůli Dueckově a Scheuerově označení. V roce 2001 Franz, Hoffmann a Salamon ukázali, že deterministická aktualizační strategie je skutečně optimální v rámci velké třídy algoritmů, které simulují náhodnou procházku po prostředí nákladů a energie. [4]

Efektivní generování kandidátů

Při výběru kandidátního generátoru Neighbor() je třeba vzít v úvahu, že po několika iteracích simulovaného žíhacího algoritmu se očekává, že aktuální stav bude mít mnohem nižší energii než náhodný stav. Obecně by tedy měl být generátor vychýlen směrem k kandidátským pohybům, kde je pravděpodobné, že energie cílového stavu $s'$ bude podobná energii aktuálního stavu. Tento heuristický (což je hlavní princip [[[Metropolis–Hastingsův algoritmus]])] má tendenci vylučovat "velmi dobré“ pohyby kandidátů i "velmi špatné“; první možnost je však obvykle mnohem méně častá než druhá, takže heuristika má obecně dobrou učínnost.

U výše uvedeného problému obchodního cestujícího se například očekává, že výměna dvou „po sobě jdoucích“ měst v průchodu s nízkou energií bude mít mírný vliv na jeho energii (délku); vzhledem k tomu, že výměna dvou "libovolných“ měst je mnohem pravděpodobnější, že prodlouží jejich délku, než ji zkrátí. Očekává se tedy, že sousední generátor prohožení bude fungovat lépe než generátor libovolného prohození, i když by tento mohl poskytnout poněkud kratší cestu k optimálnímu (s prohozením $n-1$ namísto $n(n-1)/2$ ).

Přesnější výrok heuristiky je, že je třeba vyzkoušet první kandidátské stavy $s'$ , pro které je $P(E(s),E(s'),T)$ . Pro "standardní“ akceptační funkci $P$ výše to znamená, že $E(s')-E(s)$ je v řádu $T$ nebo méně. Ve výše uvedeném příkladu obchodního cestujícího by tedy bylo možné použít funkci Neighbor(), která prohodí dvě náhodná města, kde pravděpodobnost výběru dvojice měst zmizí, jak se jejich vzdálenost zvětší za $T$ .

Vyhýbání se překážkám

Při výběru kandidátního generátoru Neighbor() je také nutné pokusit se snížit počet "hlubokých“ místních minimálních stavů(nebo sad spojených stavů), které mají mnohem nižší energii než všechny sousední stavy. Takové "uzavřené údolí“ energetické funkce mohou zachytit simulovaný žíhací algoritmus s vysokou pravděpodobností (zhruba úměrný počtu stavů v údolí) a po velmi dlouhou dobu (zhruba exponenciální na energetický rozdíl mezi okolnímy stavy a dnem údolí).

Je zpravidla nemožné navrhnout generátor kandidátů, který splní tento cíl a také upřednostní kandidáty s podobnou energií. Na druhou stranu lze často výrazně zlepšit účinnost simulovaného žíhání pomocí relativně jednoduchých změn v generátoru. Například v problému obchodního cestujícího není těžké vytvořit dva průchody $A$ , $B$ s téměř stejnou délkou tak, že (1) $A$ je optimální, (2) každá sekvence prohození párů stavů, která převádí $A$ na $B$ , prochází průchody, které jsou mnohem delší než obě, a (3) $A$ lze převést na $B$ převrácením (obrácením pořadí) sady po sobě jdoucích stavů. V tomto příkladu leží $A$ a $B$ v různých "údolí“, pokud generátor provádí pouze náhodné výměny párů; ale budou ve stejném údolí, pokud generátor provede náhodné převrácení segmentu.

Plán chlazení

Fyzikální analogie, která se používá k ospravedlnění simulovaného žíhání, předpokládá, že rychlost ochlazování je dostatečně nízká na to, aby rozdělení pravděpodobnosti současného stavu bylo vždy blízko termodynamické rovnováze. Bohužel relaxační doba, po které musí člověk po změně teploty čekat na obnovení rovnováhy silně závisí na „topografii“ energetické funkce a na aktuální teplotě. V simulovaném žíhacím algoritmu závisí doba relaxace také na kandidátním generátoru, a to velmi komplikovaným způsobem. Všimněte si, že všechny tyto parametry jsou obvykle poskytovány jako černá skříňka simulovanému žíhacímu algoritmu. Ideální rychlost chlazení proto nelze určit předem a měla by být empiricky upravena pro každý problém. Algoritmus Adaptivní simulované žíhání řeší tento problém připojením plánu chlazení k postupu hledání. Další adaptivní přístup jako termodynamické simulované žíhání, [5] automaticky upravuje teplotu v každém kroku na základě rozdílu energie mezi těmito dvěma stavy podle zákonů termodynamiky.

Reference

GRANVILLE, V.; KRIVANEK, M.; RASSON, J.-P. Simulated annealing: A proof of convergence. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1994, s. 652–656. DOI 10.1109/34.295910. (anglicky)
MOSCATO, P.; FONTANARI, J.F. Stochastic versus deterministic update in simulated annealing. Physics Letters A. 1990, s. 204–208. DOI 10.1016/0375-9601(90)90166-L. (anglicky)
DUECK, G.; SCHEUER, T. Threshold accepting: A general purpose optimization algorithm appearing superior to simulated annealing. Journal of Computational Physics. 1990, s. 161–175. ISSN 0021-9991. DOI 10.1016/0021-9991(90)90201-B. (anglicky)
FRANZ, A.; HOFFMANN, K.H.; SALAMON, P. Best optimal strategy for finding ground states. Physical Review Letters. 2001, s. 5219–5222. DOI 10.1103/PhysRevLett.86.5219. PMID 11384462. (anglicky)
DE VICENTE, Juan; LANCHARES, Juan; HERMIDA, Román. Placement by thermodynamic simulated annealing. Physics Letters A. 2003, s. 415–423. DOI 10.1016/j.physleta.2003.08.070. Bibcode 2003PhLA..317..415D. (anglicky)

Externí odkazy

Obrázky, zvuky či videa k tématu Simulované žíhání na Wikimedia Commons

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] GRANVILLE, V.; KRIVANEK, M.; RASSON, J.-P. Simulated annealing: A proof of convergence. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1994, s. 652–656. DOI 10.1109/34.295910. (anglicky)

[2] MOSCATO, P.; FONTANARI, J.F. Stochastic versus deterministic update in simulated annealing. Physics Letters A. 1990, s. 204–208. DOI 10.1016/0375-9601(90)90166-L. (anglicky)

[3] DUECK, G.; SCHEUER, T. Threshold accepting: A general purpose optimization algorithm appearing superior to simulated annealing. Journal of Computational Physics. 1990, s. 161–175. ISSN 0021-9991. DOI 10.1016/0021-9991(90)90201-B. (anglicky)

[4] FRANZ, A.; HOFFMANN, K.H.; SALAMON, P. Best optimal strategy for finding ground states. Physical Review Letters. 2001, s. 5219–5222. DOI 10.1103/PhysRevLett.86.5219. PMID 11384462. (anglicky)

[5] DE VICENTE, Juan; LANCHARES, Juan; HERMIDA, Román. Placement by thermodynamic simulated annealing. Physics Letters A. 2003, s. 415–423. DOI 10.1016/j.physleta.2003.08.070. Bibcode 2003PhLA..317..415D. (anglicky)