Učení bez učitele
Učení bez učitele (anglicky unsupervised learning) je jeden ze základních typů strojového učení. Na rozdíl od učení s učitelem algoritmy učení bez učitele nemají na vstupu data provázaná s cílovou proměnnou (labelem, targetem, závisle proměnnou...). Jejich cílem je vytvořit vhodnou a zpravidla jednodušší reprezentaci vstupních dat. Učení bez učitele si tedy lze představit jako kompresi vstupních dat: například snížení jejich dimenzionality (v analýze hlavních komponent a podobných metodách), jejich vyhlazení (odhad distribučních funkcí, na jejichž základě data vznikla) nebo jejich redukci na konečný počet diskrétních bodů (jako je tomu ve shlukové analýze, kde vstupní data reprezentujeme označeními shluků).
Praktické aplikace učení bez učitele zahrnují například:
- klasifikaci: obchodník tak může rozdělit svoje zákazníky podle jejich podobnosti do tržních segmentů anebo archeolog může podle charakteristik nalezených střepů keramiky definovat různé kulturní okruhy, k nimž patřili lidé, kteří kdysi keramiku vyráběli
- hledání anomálií: netypické datové body mohou signalizovat poruchy nebo jiné situace, na které je potřeba se zaměřit, například při detekci podvodů ve finančních a telekomunikačních firmách
- odhad latentních proměnných: psycholog může z řady výsledků jednotlivých testů stanovit inteligenci zkoumané osoby, politolog může zkoumat na základě dotazníkového šetření rekonstruovat základní dimenze politického systému v zemi
Typické algoritmy či třídy algoritmů učení bez učitele:
- shluková analýza (hierarchické shlukování, k-means a jiné)
- metody identifikující struktury kovariančních vazeb (analýza hlavních komponent, faktorová analýza, strukturní modelování a další)
- samoorganizující neuronové sítě a některé typy neuronových sítí v oblasti hlubokého učení (automatické generování textů...)
- vyhlazování a odhadování hustot pravděpodobnosti, například kernel density estimation