Lineáris vs logisztikai regresszió
A statisztikai elemzés során fontos azonosítani a vizsgálattal érintett változók közötti kapcsolatokat. Néha ez lehet magának az elemzésnek az egyetlen célja. A kapcsolat létezésének megállapítására és a kapcsolat azonosítására használt egyik erős eszköz a regressziós elemzés.
A regresszióanalízis legegyszerűbb formája a lineáris regresszió, ahol a változók közötti kapcsolat lineáris kapcsolat. Statisztikai értelemben rávilágít a magyarázó változó és a válaszváltozó közötti kapcsolatra. Például regresszió segítségével véletlenszerű mintából gyűjtött adatok alapján megállapíthatjuk a nyersanyag ára és a fogyasztás közötti kapcsolatot. A regressziós elemzés az adathalmaz regressziós függvényét állítja elő, amely a rendelkezésre álló adatokhoz legjobban illeszkedő matematikai modell. Ez könnyen ábrázolható szóródási diagrammal. Grafikusan a regresszió egyenértékű az adott adathalmazra legjobban illeszkedő görbe megtalálásával. A görbe függvénye a regressziós függvény. A matematikai modell segítségével megjósolható egy áru felhasználása adott ár mellett.
Ezért a regressziós elemzést széles körben használják előrejelzésben és előrejelzésben. Kísérleti adatok összefüggéseinek megállapítására is használják, a fizika, a kémia, valamint számos természet- és mérnöki tudományterületen. Ha a kapcsolat vagy a regressziós függvény lineáris függvény, akkor a folyamatot lineáris regressziónak nevezzük. A szóródási diagramban egyenes vonalként ábrázolható. Ha a függvény nem a paraméterek lineáris kombinációja, akkor a regresszió nemlineáris.
A logisztikus regresszió összehasonlítható a többváltozós regresszióval, és olyan modellt hoz létre, amely megmagyarázza a több előrejelző hatását egy válaszváltozóra. A logisztikus regresszióban azonban a végeredmény változónak kategorikusnak kell lennie (általában felosztva; azaz egy pár elérhető kimenetel, mint például a halál vagy a túlélés, bár a speciális technikák lehetővé teszik több kategorizált információ modellezését). A folytonos kimeneti változó átalakítható kategorikus változóvá, amelyet logisztikai regresszióhoz kell használni; a folytonos változók ilyen módon történő összecsukása azonban többnyire nem ajánlott, mert csökkenti a pontosságot.
A lineáris regresszióval ellentétben a logisztikai regresszió prediktorváltozóinak nem kell lineárisan összekapcsolódniuk, közös eloszlásúaknak lenniük, vagy minden klaszteren belül egyenlő szórással rendelkezniük. Ennek eredményeként a prediktor és az eredményváltozók közötti kapcsolat valószínűleg nem lineáris függvény.
Mi a különbség a logisztikai és a lineáris regresszió között?
• A lineáris regresszióban a magyarázó változó és a válaszváltozó között lineáris összefüggést feltételezünk, és elemzéssel megtaláljuk a modellnek megfelelő paramétereket, hogy megadjuk a pontos összefüggést.
• Lineáris regressziót hajtunk végre kvantitatív változókra, és az eredményül kapott függvény kvantitatív.
• A logisztikus regresszióban a felhasznált adatok lehetnek kategoriálisak vagy kvantitatívak, de az eredmény mindig kategorikus.