Bayesova věta
Bayesova věta (alternativně Bayesova formule, Bayesův vzorec) je věta teorie pravděpodobnosti, která udává, jak podmíněná pravděpodobnost nějakého jevu souvisí s opačnou podmíněnou pravděpodobností[1]. Poprvé na tuto souvislost upozornil anglický duchovní Thomas Bayes (1702–1761) v posmrtně vydaném článku An Essay towards solving a Problem in the Doctrine of Chances (1763). Roku 1774 větu znovu objevil francouzský matematik a fyzik Pierre-Simon Laplace, nicméně postupně upadla v zapomnění a rozšířila se až v 2. polovině 20. století.[2] Frekvenční interpretace pravděpodobnosti se poté nazývá klasická či Laplaceova, právě podle Pierre-Simona Laplace.
Jedno z mnoha použití Bayesovy věty je v oblasti statistické inference (konkrétně Bayesova inference). Věta taktéž položila základy relativně novému směru statistiky - Bayesovská statistika.[3]
Znění věty
Jednoduchá forma Bayesovy věty
Mějme dva náhodné jevy a , přičemž . Potom platí:
- kde
- je podmíněná pravděpodobnost jevu za předpokladu, že nastal jev
- je podmíněná pravděpodobnost jevu podmíněná výskytem jevu
- a jsou pravděpodobnosti jevů a
Bayesova věta
Mějme náhodné jevy a , pro . Nechť jsou jevy vzájemně neslučitelné pro každé a nechť v každém pokusu nastává právě jeden z nich, takže součet jejich pravděpodobností je roven jedné:
Potom platí:
- kde
- je podmíněná pravděpodobnost jevu za předpokladu, že nastal jev
- je podmíněná pravděpodobnost jevu za předpokladu, že nastal jev
- je pravděpodobnost jevu
Důkaz Bayesovy věty
Pro jednoduchost uvažujme pouze dva náhodné jevy. Důkaz Bayesovy věty vychází z definice podmíněné pravděpodobnosti:
kde je pravděpodobnost průniku jevů , . Symetricky:
Vyjádřením pravděpodobnosti průniku v obou rovnicích a následným dosazením jedné rovnosti do druhé, získáme výslednou Bayesovu formuli:
Alternativní forma Bayesovy věty
Při počítání s Bayesovou formulí je výhodné znát následující úpravu, jelikož často neznáme pravděpodobnost náhodných jevů, nýbrž pouze jejich pravděpodobnosti podmíněné.
Tato formule spočívá ve vhodné úpravě jmenovatele:
kde využíváme vztahu:
Po dosazení do původní věty tedy dostáváme:
Opět lze jednoduchými úvahami zobecnit pro více jevů. Mějme náhodné jevy , . Pravděpodobnost jevu lze interpretovat jako sumu součinu pravděpodobností a (Věta o úplné pravděpodobnosti), tj.
Podmíněnou pravděpodobnost jevu za pomocí výše zmíněných úvah vyjádříme následovně:
Příklady použití
Testování na drogy [5]
Nyní si ukažme příklad použití Bayesova pravidla při testování na drogy. Vyjdeme z předpokladů, že test na prokázání drog má senzitivitu 99 % a specificitu 99 %. Test se na první pohled zdá být docela přesný, ale pomocí Bayesovy věty lze ukázat, že netriviální procento testovaných může být nesprávně označeno za uživatele drog. Nechť je v testovaném podniku prevalence 0,5 %, tj. 0,5 % ze zaměstnanců drogy opravdu užívá.
Jaká je pravděpodobnost, že osoba s pozitivním testem drogy opravdu používá?
Označme si uživatele drog jako "A", "N" všechny ostatní. Nechť "+" znamená pozitivní test. Popišme si následující veličiny:
- pravděpodobnost, že osoba je uživatelem drog (prevalence), tj.
- pravděpodobnost, že osoba není uživatelem drog; zjistíme pomocí doplňkového jevu, tzn.
- pravděpodobnost, že test je pozitivní, když je osoba uživatelem drog; jinými slovy sensitivita testu:
- je pravděpodobnost, že test bude pozitivní, i přestože osoba není uživatelem drog; lze interpretovat jako doplněk k specificitě testu:
- je pravděpodobnost, že test bude pozitivní.
Pravděpodobnost sice zadanou nemáme, ale lze ji vypočítat dle výše zmíněné formule:
Po dosazení dostáváme výsledek 1,49 %:
Díky těmto údajům můžeme vypočítat žádanou pravděpodobnost pomocí Bayesovy věty:
Všimněme si, že i přes vysokou specificitu a senzitivitu je výsledek testu poměrně nepřesný. U zaměstnance podniku s pozitivním testem je jen 33% pravděpodobnost, že je skutečně uživatelem drog.
Specificita a Sensitivita
Senzitivita testu (alt. citlivost testu) nám udává úspěšnost, s níž test zachytí přítomnost sledovaného stavu (nemoci)[6] u daného subjektu. V našem příkladu to znamená, že test správně identifikuje skutečné uživatele drog v 99 % případů.
Specificita testu nám vyjadřuje úspěšnost, s níž test určí případy, u nichž zkoumaný stav (nemoc) nenastává. 99% specificita testu znamená, že test s 99% pravděpodobností správně vyloučí osobu, která drogy nepoužívá.
Odkazy
Reference
- OBERHELMAN, David D. Stanford Encyclopedia of Philosophy2001311Principal Editor, Edward N. Zalta. Stanford Encyclopedia of Philosophy. Stanford, CA: The Metaphysics Research Lab, Center for the Study of Language and Information, Stanford University 1999; updated every three months. Internet URL: http://plato.stanford.edu, ISSN: 1095-5054 Gratis Last visited: May 2001. Reference Reviews. 2001-06, roč. 15, čís. 6, s. 9–9. Dostupné online [cit. 2022-02-25]. ISSN 0950-4125. DOI 10.1108/rr.2001.15.6.9.311.
- https://www.lesswrong.com/posts/RTt59BtFLqQbsSiqd/a-history-of-bayes-theorem - A History of Bayes' Theorem
- M., Bernardo, José. Bayesian Theory.. [s.l.]: John Wiley & Sons, Ltd Dostupné online. ISBN 978-0-470-31771-6, ISBN 0-470-31771-X. OCLC 781323108
- BAZETT, Trefor. Introduction to Bayes’ Theorem. Cham: Springer International Publishing Dostupné online. ISBN 978-3-030-95792-6.
- Bayesova věta [online]. [cit. 2018-03-17]. Dostupné online.
- Senzitivita testu [online]. [cit. 2020-12-08]. Dostupné online.
Související články
Externí odkazy
- Obrázky, zvuky či videa k tématu Bayesova věta na Wikimedia Commons