Zavádějící proměnná

Ve statistice zavádějící proměnná (také matoucí proměnná nebo zavádějící faktor, anglicky confounding variable) je proměnná z(t), která ovlivňuje jak nezávislou proměnnou x(t), tak závislou proměnnou y(t), a tím vytváří korelaci mezi proměnnými x(t) a y(t), kterou může naivní analýza označit za důkaz příčinného vztahu mezi x(t) a y(t) (tj. vést k chybnému závěru, že x(t) ovlivňuje y(t), nebo naopak). Tato hypotetická příčinná vazba je ovšem falešná a skutečné vysvětlení korelace spočívá v existenci zavádějící proměnné z(t), jejíž změna je příčinou změn jak x(t), tak y(t).

Ilustrace jednoduché zavádějící proměnné. Jinými slovy, Z je příčinou X i Y.

Jinak řečeno, existence zavádějících proměnných je matematické vyjádření faktu, že korelace neimplikuje kauzalitu. Detailní rozbor možných zavádějících proměnných a jejich vlivu na pozorované korelace je důležitý pro získání věrohodných závěrů o příčinných vztazích (například závěrů typu „lék A pomáhá pacientům se symptomy B“), protože existence korelací je prakticky jediným způsobem, jak se dovtípit skutečných příčinných vztahů, ale příliš jednoduché uvažování postavené na empirických datech je často naivní a jeho závěry jsou často chybné.

Příklad

V mnoha nemocnicích převládali pacienti s covidem-19, kteří byli očkovaní, a jejich procento dokonce často převyšovalo procento očkovaných v celé populaci. Naivní závěr je, že očkování zvyšuje pravděpodobnost hospitalizace. V tomto případě ovšem tento závěr je chybný a skutečné hlavní vysvětlení se odvíjí od zavádějící proměnné „věk“, která je korelována jak s pravděpodobností očkování, tak s pravděpodobností hospitalizace. Starší lidé mají vyšší riziko hospitalizace; zároveň mají vyšší pravděpodobnost, že už byli očkováni, a proto množina lidí, kteří jsou zároveň staří a očkovaní, hraje rozhodující úlohu pro rozdělení hospitalizovaných na podskupiny. Alespoň částečná účinnost očkování plyne z faktu, že procento očkovaných mezi hospitalizovanými je nižší než procento očkovaných v nejstarších věkových skupinách, které nejvíce přispívají k počtům pacientů v nemocnicích.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.