Különbség a Semi Join és a Bloom Join között

Különbség a Semi Join és a Bloom Join között
Különbség a Semi Join és a Bloom Join között

Videó: Különbség a Semi Join és a Bloom Join között

Videó: Különbség a Semi Join és a Bloom Join között
Videó: Nintendo Wii vs WiiU 2024, November
Anonim

Semi Join vs Bloom Join

A félig csatlakozás és a Bloom join az elosztott adatbázisok lekérdezésfeldolgozásában használt két összekapcsolási módszer. Az elosztott adatbázisokban lévő lekérdezések feldolgozásakor adatokat kell átvinni a különböző helyeken található adatbázisok között. Ez költséges művelet lehet, attól függően, hogy mennyi adatot kell átvinni. Ezért az elosztott adatbázis-környezetben végzett lekérdezések feldolgozása során fontos a lekérdezések optimalizálása a helyek közötti adatátvitel minimálisra csökkentése érdekében. A félig összekapcsolás és a bloom join két módszer, amellyel csökkenthető az adatátvitel mennyisége, és hatékony lekérdezések feldolgozása végezhető el.

Mi az a Semi Join?

A félig csatlakozás egy olyan módszer, amelyet a hatékony lekérdezések feldolgozására használnak elosztott adatbázis-környezetekben. Vegyünk egy olyan helyzetet, amikor egy alkalmazotti adatbázis (amely olyan információkat tartalmaz, mint az alkalmazott neve, osztályszáma, ahol dolgozik stb.) az 1. telephelyen található, és egy Osztály adatbázis (például osztályszám, osztálynév, hely stb.) a helyszínen található. 2. Például, ha meg akarjuk szerezni az alkalmazott nevét és az osztály nevét, amelynek dolgozik (csak a „New York-i részlegeknél”), a 3. telephelyen található lekérdezésfeldolgozóval végrehajtva egy lekérdezést, többféleképpen is A feladat megvalósítása érdekében a három helyszín között adatátvitelre kerülhet sor. Az adatok átvitelénél azonban fontos megjegyezni, hogy nem szükséges a teljes adatbázist a helyek között átvinni. Csak néhány attribútumot (vagy sorokat), amelyek az összekapcsoláshoz szükségesek, kell átvinni a helyek között a lekérdezés hatékony végrehajtásához. A félig összekapcsolás egy olyan módszer, amellyel csökkenthető a helyek között továbbított adatmennyiség. A félig összekapcsolásnál csak az összekapcsolási oszlop kerül át az egyik helyről a másikra, majd ezt az átvitt oszlopot használják fel a többi helyek közötti szállított kapcsolatok méretének csökkentésére. A fenti példában egyszerűen átviheti a 2. helyről a hely=”New York” sorok osztályszámát és osztálynevét a 2. helyről az 1. helyre, és végrehajthatja az összekapcsolást az 1. helyen, és a végső relációt visszaviheti a 3. helyre.

Mi az a Bloom Join?

Amint korábban említettük, a bloom join egy másik módszer, amellyel elkerülhető a szükségtelen adatok átvitele a helyek között, amikor lekérdezéseket hajt végre elosztott adatbázis-környezetekben. Bloom join esetén ahelyett, hogy magát az illesztési oszlopot átvinnénk, az illesztési oszlop kompakt ábrázolása kerül átvitelre a helyek között. A Bloom join egy bloom szűrőt használ, amely egy bitvektort alkalmaz a tagsági lekérdezések végrehajtásához. Először egy virágszűrőt építenek az összekötő oszlop segítségével, amely átkerül a helyek között, majd elvégzik az összekapcsolási műveleteket.

Mi a különbség a Semi Join és a Bloom Join között?

Annak ellenére, hogy mind a semi join, mind a bloom join módszert használják a helyek között továbbított adatmennyiség minimalizálására, amikor lekérdezéseket hajtanak végre elosztott adatbázis környezetben, a bloom join csökkenti az átvitt adatok mennyiségét (a sorok számát) összehasonlítva félig csatlakozik a bloom szűrők koncepciójának felhasználásával, amelyek egy bitvektort alkalmaznak a halmaztagságok meghatározására. Ezért a bloom join használata hatékonyabb lesz, mint a félig összekapcsolás.

Ajánlott: