Átlag vs medián vs mód
Az átlag, a medián és a módus a leíró statisztikákban használt központi tendencia elsődleges mérőszámai. Teljesen különböznek egymástól, és az adatok összegzésére szolgáló esetek is eltérőek.
Átlagos
A számtani átlag az adatértékek összege osztva az adatértékek számával, azaz
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Ha az adatok egy mintatérből származnak, azt mintaátlagnak nevezzük ([latex]\bar{x} [/latex]), amely a minta leíró statisztikája. Bár ez a leggyakrabban használt leíró mérőszám egy mintára, ez nem egy robusztus statisztika. Nagyon érzékeny a kiugró értékekre és az ingadozásokra.
Vegyük például egy adott város polgárainak átlagos jövedelmét. Mivel az összes adatértéket összeadják, majd felosztják, egy rendkívül gazdag ember jövedelme jelentősen befolyásolja az átlagot. Ezért az átlagértékek nem mindig jól reprezentálják az adatokat.
Váltakozó jel esetén az elemen áthaladó áram időszakosan változik pozitív irányból negatív irányba és fordítva. Ha az elemen egyetlen periódus alatt áthaladó átlagos áramerősséget vesszük, akkor 0-t adunk, vagyis nem haladt át áram az elemen, ami nyilvánvalóan nem igaz. Ezért a számtani átlag ebben az esetben sem jó mérőszám.
A számtani átlag jó mutató, ha az adatok egyenletesen oszlanak el. Normális eloszlás esetén az átlag egyenlő a módussal és a mediánnal. Ennek van a legalacsonyabb reziduuma is, ha figyelembe vesszük az átlagos négyzetes hibát; ezért a legjobb leíró mérték, ha egy adatkészletet egyetlen számmal kell ábrázolni.
Medián
A középső adatpont értékei az összes adatérték növekvő sorrendbe rendezése után az adatkészlet mediánjaként vannak definiálva. A medián a 2. kvartilis, az 5. decilis és az 50. percentilis.
• Ha a megfigyelések (adatpontok) száma páratlan, akkor a medián az a megfigyelés, amely pontosan a rendezett lista közepén van.
• Ha a megfigyelések (adatpontok) száma páros, akkor a medián a rendezett lista két középső megfigyelésének átlaga.
A medián a megfigyelést két csoportra osztja; azaz a mediánnál magasabb értékek csoportja (50%) és a mediánnál alacsonyabb értékek csoportja (50%). A mediánokat kifejezetten ferde eloszlásokban használják, és az adatokat sokkal jobban reprezentálják, mint a számtani átlag.
Mód
A mód a legtöbbször előforduló szám a megfigyelések sorozatában. Az adathalmaz módozatának kiszámítása a halmazon belüli egyes elemek gyakoriságának meghatározásával történik.
• Ha egyetlen érték sem fordul elő többször, akkor az adatkészletnek nincs módja.
• Ellenkező esetben minden olyan érték, amely a legnagyobb gyakorisággal fordul elő, az adatkészlet egyik módja.
Egynél több mód is létezhet egy halmazban; ezért a mód nem egy adathalmaz egyedi statisztikája. Egyenletes eloszlásban egy mód van. A diszkrét valószínűségi eloszlás módusa az a pont, ahol a valószínűségi tömegfüggvény eléri legmagasabb pontját. A fenti értelmezések alapján azt mondhatjuk, hogy a globális maximumok módusok.
Fontoljuk meg mindhárom intézkedés alkalmazását a következő adatkészletre.
ADATOK: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Átlag=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Medián=9 (13. elem)
Mód=9 (9-es gyakoriság=5)
Mi a különbség az átlag, a medián és a mód között?
• A számtani átlag az értékek (megfigyelések) összege osztva a megfigyelések számával. Ez nem egy robusztus statisztika, és erősen függ a vizsgált eloszláson belüli normális eloszlás természetétől. Egyetlen kiugró érték jelentős eltolódást okozhat az átlagban, ami viszonylag félrevezető értékeket ad. A fogalom kiterjeszthető geometriai átlagra, harmonikus átlagra, súlyozott átlagra és így tovább.
• A medián a megfigyelések halmazának középértéke, és viszonylag kevésbé befolyásolják a kiugró értékek. Erősen ferde esetekben jó becslést adhat összefoglaló statisztikaként.
• A mód a leggyakoribb megfigyelési értékek az adatkészletben. Ha az eloszlás pozitív ferde, a módusz balra a mediánhoz, ha pedig negatívan ferde, a módusz jobbra a mediánhoz.
• Ha pozitívan ferde, az átlag megfelel a mediánnak; ha a negatívan ferde átlag a mediántól balra van.
• A normál eloszlásban mindhárom, átlag, módus és medián egyenlő.