Különbség az adatbányászat és az OLAP között

Különbség az adatbányászat és az OLAP között
Különbség az adatbányászat és az OLAP között

Videó: Különbség az adatbányászat és az OLAP között

Videó: Különbség az adatbányászat és az OLAP között
Videó: KAP elmondja a lényegi különbséget Nők és Férfiak közt 😀 2024, Július
Anonim

Adatbányászat vs OLAP

Mind az adatbányászat, mind az OLAP a két általános üzleti intelligencia (BI) technológia. Az üzleti intelligencia olyan számítógép-alapú módszereket jelent, amelyek segítségével azonosíthatók és kinyerhetők az üzleti adatokból hasznos információk. Az adatbányászat a számítástechnikának az a területe, amely érdekes minták kinyerésével foglalkozik nagy adathalmazokból. Számos módszert egyesít a mesterséges intelligenciától, a statisztikáktól és az adatbázis-kezeléstől. Az OLAP (online analitikai feldolgozás), ahogy a neve is sugallja, a többdimenziós adatbázisok lekérdezésének módjainak összeállítása.

Az adatbányászat más néven Knowledge Discovery in data (KDD). Mint fentebb említettük, ez a számítástechnika olyan területe, amely korábban ismeretlen és érdekes információk nyers adatokból való kinyerésével foglalkozik. Az adatok exponenciális növekedése miatt, különösen az olyan területeken, mint az üzleti élet, az adatbányászat nagyon fontos eszközzé vált ennek a rengeteg adatnak az üzleti intelligenciává történő átalakítására, mivel a minták kézi kinyerése az elmúlt évtizedekben látszólag lehetetlenné vált. Például jelenleg különféle alkalmazásokhoz használják, például közösségi hálózatok elemzéséhez, csalások felderítéséhez és marketinghez. Az adatbányászat általában a következő négy feladattal foglalkozik: klaszterezés, osztályozás, regresszió és asszociáció. A klaszterezés hasonló csoportok azonosítását jelenti strukturálatlan adatokból. Az osztályozás olyan tanulási szabályok, amelyek új adatokra alkalmazhatók, és jellemzően a következő lépéseket tartalmazzák: adatok előfeldolgozása, modellezés tervezése, tanulás/funkció kiválasztása és értékelése/validálása. A regresszió olyan függvények keresése, amelyek minimális hibával modellezhetik az adatokat. Az asszociáció pedig a változók közötti kapcsolatokat keresi. Az adatbányászatot általában olyan kérdések megválaszolására használják, mint például, hogy melyek azok a fő termékek, amelyek segíthetnek nagy profitot elérni a következő évben a Wal-Martban.

OLAP a rendszerek egy osztálya, amely többdimenziós lekérdezésekre ad választ. Az OLAP-ot általában marketingre, költségvetésre, előrejelzésre és hasonló alkalmazásokra használják. Magától értetődik, hogy az OLAP-hoz használt adatbázisok összetett és ad-hoc lekérdezésekre vannak beállítva, a gyors teljesítmény szem előtt tartásával. Általában egy mátrixot használnak az OLAP kimenetének megjelenítésére. A sorokat és oszlopokat a lekérdezés méretei alkotják. Gyakran használnak összesítési módszereket több táblán, hogy összefoglalókat kapjanak. Például lehet vele tájékozódni a Wal-Mart idei eladásairól a tavalyihoz képest? Mi az előrejelzés a következő negyedév eladásairól? Mit mondhatunk a trendről, ha megnézzük a százalékos változást?

Bár nyilvánvaló, hogy az adatbányászat és az OLAP hasonlóak, mivel adatokon működnek az intelligencia megszerzése érdekében, a fő különbség az adatokkal való működésükből adódik. Az OLAP eszközök többdimenziós adatelemzést és összegzést biztosítanak az adatokról, de ezzel ellentétben az adatbányászat az adathalmazban lévő arányokra, mintázatokra és hatásokra összpontosít. Ez egy OLAP-megállapodás az aggregációval, ami az adatok „összeadáson” keresztüli működésére torkollik, de az adatbányászat az „osztásnak” felel meg. Egy másik figyelemre méltó különbség az, hogy míg az adatbányászati eszközök az adatokat modellezik és végrehajtható szabályokat adnak vissza, az OLAP valós időben végez összehasonlítási és kontrasztos technikákat az üzleti dimenzió mentén.

Ajánlott: