Rozptyl (štatistika)
Rozptyl (iné názvy: variancia, disperzia, stredná kvadratická odchýlka, stredná kvadratická fluktuácia) je najčastejšie používaná miera variability.
Hodnota rozptylu je závislá od odchýlky štatistiky od priemeru. Ak chápeme štatistický súbor ako realizáciu náhodného výberu z určitého rozdelenia, potom rozptyl určuje strednú kvadratickú odchýlku jednotlivých nameraných hodnôt od výberového priemeru.
Definícia
Nech je náhodná premenná, ktorá nadobúda konečne alebo spočítateľne veľa hodnôt. Potom definujeme rozptyl ako
- .
Ďalším často používaným vzťahom na výpočet rozptylu je
- ,
ku ktorému môžeme prísť odvodením zo základného vzťahu. Ak je každý výsledok rovnako pravdepodobný a je ich konečne veľa, uvedený vzťah možno prepísať do tvaru
- .
Ak uvažujeme náhodnú premennú , ktorá nadobúda nekonečne veľa, resp. nespočítateľne veľa hodnôt, teda je spojitá, používame na výpočet variancie vzťah
- ,
kde je funkcia hustoty pravdepodobnosti príslušného rozdelenia.
Vlastnosti rozptylu
- Rozptyl má aditívnu vlastnosť len v prípade, že náhodné premenné v jeho argumente sú nezávislé.
- Pri transformácii náhodnej premennej , kde je konštanta platí
- Rozptyl môžeme prepísať z definičného tvaru do nasledovného, z ktorého je jasné, že ide o strednú hodnotu istej transformácie pôvodnej náhodnej premennej
Použitie a príklady
Hodnota rozptylu je vždy kladná, čo vyplýva z toho, že pracujeme s druhou mocninou odchýlky. Druhú odmocninu z rozptylu nazývame smerodajná odchýlka a označujeme
Pomocou štandardnej odchýlky a korelačného koeficientu možno vyjadriť kovarianciu nasledovným spôsobom
Rozptyl vystupuje aj v dôležitej Čebyševovej nerovnosti, ktorá sa využíva pri dôkaze slabého zákona veľkých čísel.
Príklad
Rozptyl rovnomerného rozdelenia na intervale [-1,+1] je