Paraméter vs statisztika
Vegye fontolóra ezeket a kérdéseket; mekkora egy ember átlagos jövedelme az Ön országában, mekkora a nők átlagos magassága a világon, és mekkora az egyes tyúkfajták által termelt tojások átlagos súlya? Lehetetlen olyan felmérést készíteni, amely az összes érdeklődő tárgyat tartalmazza. Az első esetben az országod összes embere, a második esetben a világ összes nője, a harmadik esetben pedig az adott tyúkfajta által termelt összes tojás. Ezt az összes elemet tartalmazó nagyobb halmazt populációnak nevezik a statisztikai nyelvben.
Ha azonban a sokaságból úgy választunk ki korlátozott számú elemet, hogy az az összes többit reprezentálja, a részhalmaz elemzésével következtethetünk a sokaság tulajdonságaira. A sokaság ezen részhalmazát mintának nevezzük. A leíró statisztikai mérőszámokat a sokaság főbb tulajdonságainak összefoglalására és magyarázatára használják.
További információ a paraméterről
A sokaság leíró mértékét (például átlag, módus vagy medián) paraméterként ismerjük. Számszerűen fejezi ki egy attribútum értékét a rendelkezésre álló adatok összegzésével. Amint azt korábban jeleztük, lehetetlen figyelembe venni az attribútum értékeit a teljes sokaságra vonatkozóan. Ezért a minta alapján számítják ki a mértékeket, majd következtetnek belőlük a sokaságba.
Azonban kivételes esetekben, például teljes népszámlálás és szabványos tesztek esetén a paramétereket a sokaságból számítják ki.
A klasszikus valószínűségelméletben egy paraméter állandó, de „ismeretlen értéke” van, amelyet a mintákon alapuló becslések határoznak meg. A modern Bayes-féle valószínűség szerint a paraméterek valószínűségi változók, és bizonytalanságukat eloszlásként írják le.
További információ a Statisztikáról
A statisztika a minta leíró mérőszáma. A paraméterrel ellentétben a mintaértékek a sokaságból nyert véletlenszerű mintából kerülnek kiszámításra. Formálisabban a minta függvényeként van meghatározva, de független a minta eloszlásától.
Következtetéskor a statisztika a paraméterek becsléseként szolgál. A minta átlaga, a minta szórása és szórása, a kvantilisek, például kvartilisek és percentilisek, valamint a sorrendi statisztikák, például a maximum és a minimum, mind a minta statisztikai kategóriájába tartoznak.
A statisztika megfigyelhetősége a statisztikát és a paramétert elválasztó fő tényező. Egy populációban a paraméter nem közvetlenül megfigyelhető, de egy mintában a statisztika könnyen megfigyelhető, legtöbbször egy-két számítás távolságra. Ezenkívül a statisztikáknak olyan fontos tulajdonságai vannak, mint a teljesség, elegendőség, konzisztencia, elfogulatlanság, robusztusság, számítási kényelem, alacsony szórás, és az átlagos négyzetes hiba minimális.
Mi a különbség a paraméter és a statisztika között?
• A paraméter a sokaság leíró mértéke, a statisztika pedig a minta leíró mértéke.
• A paraméterek közvetlenül nem számíthatók, de a statisztikák kiszámíthatók és közvetlenül megfigyelhetők.
• A paraméterek levezetése (következtetése) a statisztikákból történik, és a statisztika a populációs paraméter becsléseként szolgál. (A minta átlaga (x ̅) a sokaságátlag µ becsléseként működik)
• A paraméterben az értékek nem feltétlenül egyenlőek a minta értékeivel, hanem hozzávetőlegesek.