Szabvány eltérés vs átlag
A leíró és következtetéses statisztikában számos indexet használnak egy adatsor leírására, amely megfelel annak központi tendenciájának, szórásának és ferdeségének. Statisztikai következtetésként ezeket általában becslőnek nevezik, mivel a populációs paraméterek értékeit becsülik meg.
A központi tendencia az értékek eloszlásának középpontjára utal, és annak középpontját határozza meg. Az átlag, a mód és a medián a leggyakrabban használt indexek egy adatkészlet központi tendenciájának leírására. A diszperzió az eloszlás középpontjából terjedő adatok mennyisége. A tartomány és a szórás a leggyakrabban használt szóródási mérték. A Pearson-féle ferdeségi együtthatók az adatok eloszlásának ferdeségének leírására szolgálnak. Itt a ferdeség azt jelenti, hogy az adatkészlet szimmetrikus-e a középpontra, és ha nem, mennyire ferde.
Mit jelent?
Az átlag a központi tendencia leggyakrabban használt mutatója. Egy adathalmaz esetén az átlagot úgy számítjuk ki, hogy az összes adatérték összegét elosztjuk az adatok számával. Például 10 ember súlya (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79. Ekkor a tíz ember átlagos súlya (kilogrammban) a következőképpen számítjuk ki. A súlyok összege 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Átlag=(összeg) / (adatok száma)=710 / 10=71 (kilogrammban).
Amint ebben a konkrét példában, egy adatkészlet átlagértéke nem lehet a halmaz adatpontja, hanem egyedi lesz egy adott adatkészletre. A Mean egységei megegyeznek az eredeti adatokkal. Ezért az adatokkal azonos tengelyen jelölhető, és összehasonlításban használható. Ezenkívül nincs előjel-korlátozás az adatkészlet átlagára vonatkozóan. Lehet negatív, nulla vagy pozitív, mivel az adatkészlet összege lehet negatív, nulla vagy pozitív.
Mi az a szórás?
A szórás a leggyakrabban használt diszperziós index. A szórás kiszámításához először az adatértékek átlagtól való eltérését kell kiszámítani. Az eltérések négyzetgyökértékét szórásnak nevezzük.
Az előző példában a megfelelő eltérések az átlagtól: (70-71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 és (79-71)=8. Az eltérés négyzeteinek összege (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. A szórás: √(366/10)=6,05 (kilogrammban). Ebből arra lehet következtetni, hogy az adatok többsége a 71±6 intervallumban található.05, feltéve, hogy az adatkészlet nem nagyon ferde, és ez ebben a konkrét példában valóban így van.
Mivel a szórás mértékegységei megegyeznek az eredeti adatokkal, így mérjük, hogy az adatok mennyire térnek el a középponttól; nagyobb a szórás nagyobb a diszperzió. Ezenkívül a szórás nemnegatív érték lesz, függetlenül az adatkészletben lévő adatok természetétől.
Mi a különbség a szórás és az átlag között?
• A szórás a középponttól való diszperzió mértéke, míg az átlag az adathalmaz középpontjának helyét méri.
• A szórás mindig nemnegatív érték, de az átlag bármilyen valós értéket vehet fel.