Szórás vs standard eltérés
A variáció gyakori jelenség a statisztika tanulmányozásában, mert ha nem lett volna eltérés az adatokban, valószínűleg nem is lenne szükségünk statisztikára. A variációt a statisztikában szórásnak nevezik, amely az értékek és az átlaguk távolságának mértéke. A szórás kicsi vagy kicsi, ha az értékeket az átlaghoz közelebb csoportosítjuk. A szórás egy másik mérőszám a várt eredmények és azok tényleges értékei közötti különbség leírására. Bár mindkettő szorosan összefügg, vannak különbségek a variancia és a szórás között, amelyeket ebben a cikkben tárgyalunk.
A nyers értékek semmilyen eloszlásban értelmetlenek, és nem vonhatunk le belőlük értelmes információt. A szórás segítségével tudjuk felmérni egy érték jelentőségét, mivel az megmutatja, milyen messze vagyunk az átlagtól. A variancia koncepciójában hasonló a szóráshoz, kivéve, hogy ez az SD négyzetes értéke. A variancia és a szórás fogalmát érdemes egy példa segítségével megérteni.
Tegyük fel, hogy van egy gazda, aki tököt termeszt. Tíz különböző súlyú sütőtökje van, amelyek a következők.
2,6, 2,6, 2,8, 3,0, 3,1, 3,2, 3,3, 3,5, 3,6, 3,8. Könnyű kiszámítani a sütőtök átlagos súlyát, mivel ez az összes érték összege osztva 10-zel. Ebben az esetben ez 3,15 font. Azonban egyik sütőtök sem nyom ennyit, és súlyuk az átlagosnál 0,55 fonttól könnyebb és 0,65 fonttal nehezebb. Most a következő módon írhatjuk fel az egyes értékek különbségét az átlagtól
-0,55, -0,55, -0,35, -0,15, -0,05, 0,15, 0,35, 0,45, 0,65.
Mit lehet kihozni ezekből az átlagtól való eltérésekből., Ha megpróbáljuk megtalálni az átlagos különbséget, azt látjuk, hogy nem találunk átlagot, mivel összeadáskor a negatív értékek egyenlőek a pozitív értékekkel, így az átlagos különbség nem számítható ki. Ezért döntöttek úgy, hogy az összes értéket négyzetre emelik, mielőtt összeadnák és meghatároznák az átlagot. Ebben az esetben a négyzetes értékek a következőképpen jönnek létre
0,3025, 0,3025, 0,1225, 0,0225, 0,0025, 0,0025, 0,1225, 0,2025, 0,4225.
Most ezeket az értékeket összeadhatja és eloszthatja tízzel, hogy megkapja a variancia néven ismert értéket. Ez a szórás ebben a példában 0,1525 font. Ennek az értéknek nincs nagy jelentősége, mivel a különbséget négyzetre emeltük, mielőtt megtaláltuk az átlagot. Ez az oka annak, hogy meg kell találnunk a variancia négyzetgyökét, hogy megkapjuk a szórást. Ebben az esetben 0,3905 font.
Röviden:
• Mind a variancia, mind a szórás az értékek szórásának mértéke bármely adatban.
• A szórást úgy számítjuk ki, hogy az egyéni különbségek négyzeteinek átlagát vesszük a minta átlagából
• A szórás az eltérés négyzetgyöke.