Regresszió vs korreláció
A statisztikában fontos a két valószínűségi változó közötti kapcsolat meghatározása. Lehetővé teszi, hogy előrejelzéseket készítsünk egy változóról a többihez képest. A regresszióanalízist és a korrelációt időjárás-előrejelzésekben, pénzügyi piacok viselkedésében, fizikai kapcsolatok kísérletekkel történő megállapításában és sokkal több valós forgatókönyvben alkalmazzák.
Mi a regresszió?
A regresszió egy statisztikai módszer, amellyel két változó közötti összefüggést rajzolják meg. Az adatok gyűjtése során gyakran előfordulhatnak olyan változók, amelyek másoktól függenek. A változók közötti pontos kapcsolat csak regressziós módszerekkel állapítható meg. Ennek a kapcsolatnak a meghatározása segít megérteni és előre jelezni az egyik változó viselkedését a másikkal szemben.
A regressziós elemzés legáltalánosabb alkalmazása a függő változó értékének becslése egy adott értékre vagy a független változók értéktartományára. Például regresszió segítségével egy véletlenszerű mintából gyűjtött adatok alapján megállapíthatjuk a nyersanyag ára és a fogyasztás közötti kapcsolatot. A regressziós elemzés egy adathalmaz regressziós függvényét állítja elő, amely egy olyan matematikai modell, amely a legjobban illeszkedik a rendelkezésre álló adatokhoz. Ez könnyen ábrázolható szóródási diagrammal. Grafikusan a regresszió egyenértékű az adott adatkészlethez legjobban illeszkedő görbe megtalálásával. A görbe függvénye a regressziós függvény. A matematikai modell segítségével megjósolható egy áru kereslete adott ár mellett.
Ezért a regressziós elemzést széles körben használják előrejelzésben és előrejelzésben. Kísérleti adatokkal kapcsolatos kapcsolatok kialakítására is használják a fizika, a kémia, valamint számos természettudomány és mérnöki tudomány területén. Ha a kapcsolat vagy a regressziós függvény lineáris függvény, akkor a folyamatot lineáris regressziónak nevezzük. A szóródási diagramban egyenes vonalként ábrázolható. Ha a függvény nem a paraméterek lineáris kombinációja, akkor a regresszió nemlineáris.
Mi a korreláció?
A korreláció a két változó közötti kapcsolat erősségének mértéke. A korrelációs együttható számszerűsíti az egyik változó változásának mértékét a másik változó változása alapján. A statisztikában a korreláció a függőség fogalmához kapcsolódik, amely két változó közötti statisztikai kapcsolat.
A Pearsons-féle korrelációs együttható vagy csak az r korrelációs együttható -1 és 1 közötti érték (-1≤r≤+1). Ez a leggyakrabban használt korrelációs együttható, és csak a változók közötti lineáris kapcsolatra érvényes. Ha r=0, nincs összefüggés, és ha r≥0, akkor a kapcsolat egyenesen arányos; azaz az egyik változó értéke a másik növekedésével nő. Ha r≤0, az összefüggés fordítottan arányos; azaz az egyik változó csökken a másik növekedésével.
A linearitási feltétel miatt az r korrelációs együttható a változók közötti lineáris kapcsolat megállapítására is használható.
Mi a különbség a regresszió és a korreláció között?
A regresszió adja meg a két valószínűségi változó közötti kapcsolat formáját, a korreláció pedig a kapcsolat erősségét.
A regressziós elemzés egy regressziós függvényt hoz létre, amely segít extrapolálni és előre jelezni az eredményeket, míg a korreláció csak arról nyújt információt, hogy milyen irányban változhat.
A pontosabb lineáris regressziós modelleket az elemzés adja, ha a korrelációs együttható magasabb. (|r|≥0,8)