Medián
Medián (označován Me nebo ) je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd.[1]
Pro nalezení mediánu daného souboru stačí hodnoty seřadit podle velikosti a vzít hodnotu, která se nalézá uprostřed seznamu. Pokud má soubor sudý počet prvků, obvykle se za medián označuje aritmetický průměr hodnot na místech n/2 a n/2+1.
Obecně se za medián dá označit více čísel. V už zmíněném případě sudého počtu prvků neexistuje jedinečná hodnota. Platí však, že polovina hodnot je menší nebo rovna a polovina prvků je větší nebo rovna, ať už se za medián zvolí libovolné z obou prostředních čísel. Totéž dokonce platí i pro libovolné číslo, jehož velikost leží mezi těmito dvěma čísly. Proto se jako medián takového souboru může vzít libovolné z obou prostředních čísel i libovolné z čísel mezi nimi.
Výhody a nevýhody mediánu
Základní výhodou mediánu jako statistického ukazatele je fakt, že není ovlivněn extrémními hodnotami. Proto se často používá v případě šikmých rozdělení, u kterých aritmetický průměr dává obvykle nevhodné výsledky. Např. u souboru { 1, 2, 2, 3, 9 } je medián (stejně jako modus) roven dvěma, což je zřetelně vhodnější míra polohy než aritmetický průměr, který je zde roven 3,4.[2]
Další výhodou je, že medián lze definovat na každém souboru uspořádaném relací „menší nebo rovno“, i když se nejedná o soubor čísel. Například medián souboru {bez základního vzdělání, absolvent ZŠ, vyučen, vyučen s maturitou, vysokoškolák} je roven hodnotě „vyučen“, pokud kategorie vzdělání považujeme za seřazené podle náročnosti školy.
Nevýhodné je obvykle použití mediánu u souborů, ve kterých sledovaný znak nabývá jen dvou možných hodnot. Tam se medián chová stejně jako modus: je hrubým měřítkem vlastností rozdělení a v případě, že obě kategorie jsou zastoupeny zhruba stejně, je velmi nestabilní.
Teoretické vlastnosti
V případě rozdělení pravděpodobnosti je mediánem číslo m, které splňuje rovnost P(X ≤ m) ≥ 0,5 a P(X ≥ m) ≥ 0,5. V případě spojité reálné jednorozměrné náhodné veličiny s hustotou pravděpodobnosti f pro medián platí:
Medián nemusí být výše uvedenou rovností určen jednoznačně.
Medián je také odhad hodnoty, který minimalizuje odchylku. U předchozího příkladu je tato chyba při použití mediánu rovna 1 + 0 + 0 + 1 + 7 = 9, zatímco při použití aritmetického průměru by byla rovna 2,4 + 1,4 + 1,4 + 0,4 + 5,6 = 11,2. To znamená, že číslo m, které minimalizuje výraz E(|X − m|), je mediánem rozdělení náhodné veličiny X.
Pro rozdělení náhodné veličiny, které mají konečnou střední hodnotu a medián platí, že absolutní hodnota rozdílu mezi mediánem a aritmetickým průměrem daného rozdělení je menší nebo rovna jedné směrodatné odchylce.[zdroj?]
Dá se ukázat, že (výběrový) medián je maximálně věrohodným odhadem střední hodnoty Laplaceova rozdělení.
Medián jako kvantil
Medián je nejspíš nejpoužívanější kvantil. Kromě mediánu se velmi často používají kvartily (soubor se dělí na čtyři části), decily (na deset částí) a percentily (na sto částí).[3]
Reference
- Výpočet mediánu (statistika). www.hackmath.net [online]. [cit. 2021-08-16]. Dostupné online.
- Medián — Matematika polopatě. www.matweb.cz [online]. [cit. 2021-08-16]. Dostupné online.
- BEDÁŇOVÁ, Iveta. BIOSTATISTIKA , Multimediální výukový text pro studenty [online]. VFU Brno, 2017 [cit. 2021-08-16]. Dostupné online.
Související články
Externí odkazy
- Obrázky, zvuky či videa k tématu medián na Wikimedia Commons