Korreláció vs kovariancia
A korreláció és a kovariancia szorosan összefüggő fogalmak az elméleti statisztikában. Fontosak a két valószínűségi változó közötti kapcsolat meghatározásában.
Mi a korreláció?
A korreláció a két változó közötti kapcsolat erősségének mértéke. A korrelációs együttható számszerűsíti az egyik változó változásának mértékét a másik változó változása alapján. A statisztikában a korreláció a függőség fogalmához kapcsolódik, amely két változó statisztikai kapcsolata
A Pearson-féle korrelációs együttható vagy csak az r korrelációs együttható -1 és 1 közötti érték (-1≤r≤+1). Ez a leggyakrabban használt korrelációs együttható, és csak a változók közötti lineáris kapcsolatra érvényes. Ha r=0 nincs összefüggés, és ha r≥0, akkor az összefüggés egyenesen arányos; az egyik változó értéke a másik növekedésével nő. Ha r≤0, az összefüggés fordítottan arányos; az egyik változó csökken a másik növekedésével.
A linearitási feltétel miatt az r korrelációs együttható a változók közötti lineáris kapcsolat megállapítására is használható.
Mi az a kovariancia?
A statisztikai elméletben a kovariancia annak mértéke, hogy két valószínűségi változó együtt mennyit változik. Más szavakkal, a kovariancia a két valószínűségi változó közötti korreláció erősségének mértéke.
Másik szemszögből látható, hogy a korreláció csak a kovariancia normalizált változata, ahol a kovariancia el van osztva a két valószínűségi változó szórásának szorzatával. A kovariancia tartománya nagy lehet; ezért nem könnyű összehasonlítani. Ezt a nehézséget úgy hárítjuk el, hogy a kovariancia értékeket egy olyan tartományba hozzuk, ahol a normalizálással összehasonlíthatóak (olyan, mint a z-score). Bár a kovariancia és a variancia a fenti módon kapcsolódnak egymáshoz, valószínűségi eloszlásaik nem kapcsolódnak egymáshoz egyszerűen, és külön kell kezelni őket.
Mi a különbség a korreláció és a kovariancia között?
• Mind a korreláció, mind a kovariancia a két valószínűségi változó közötti kapcsolat mértéke. A korreláció a két változó linearitásának erősségét, a kovariancia pedig a korreláció erősségét méri.
• A korrelációs együttható értékek -1 és +1 közötti értékek, míg a kovariancia tartománya nem állandó, de lehet pozitív vagy negatív. De ha a valószínűségi változókat standardizáljuk a kovariancia kiszámítása előtt, akkor a kovariancia egyenlő a korrelációval, és értéke -1 és +1 között van.