Fő különbség – felügyelt és nem felügyelt gépi tanulás
A felügyelt tanulás és a felügyelet nélküli tanulás a gépi tanulás két alapvető fogalma. A felügyelt tanulás egy gépi tanulási feladat egy olyan függvény megtanulására, amely a bemenetet kimenetre képezi le a példa bemenet-kimenet párok alapján. A felügyelet nélküli tanulás a gépi tanulás feladata, amelynek során a rejtett struktúrát leíró függvényre következtet a címkézetlen adatokból. A fő különbség a felügyelt és a nem felügyelt gépi tanulás között az, hogy a felügyelt tanulás címkézett adatokat használ, míg a nem felügyelt tanulás címkézetlen adatokat.
A gépi tanulás a számítástechnika olyan területe, amely lehetővé teszi a számítógépes rendszerek számára, hogy az adatokból tanuljanak anélkül, hogy kifejezetten programoznák őket. Lehetővé teszi az adatok elemzését és a bennük lévő minták előrejelzését. A gépi tanulásnak számos alkalmazása létezik. Ezek közül néhány az arcfelismerés, a gesztusfelismerés és a beszédfelismerés. Különféle algoritmusok kapcsolódnak a gépi tanuláshoz. Ezek közül néhány a regresszió, az osztályozás és a klaszterezés. A gépi tanuláson alapuló alkalmazások fejlesztésének leggyakoribb programozási nyelvei az R és a Python. Más nyelvek, például Java, C++ és Matlab is használhatók.
Mi az a felügyelt tanulás?
A gépi tanuláson alapuló rendszerekben a modell egy algoritmus szerint működik. A felügyelt tanulás során a modell felügyelt. Először is meg kell tanítani a modellt. A megszerzett ismeretekkel megjósolhatja a válaszokat a jövő eseteire. A modell betanítása egy címkézett adatkészlet segítségével történik. Ha a mintaadatokon kívüli adatot adnak meg a rendszernek, meg tudja jósolni az eredményt. Az alábbiakban egy kis kivonat a népszerű IRIS adatkészletből.
A fenti táblázat szerint a csészelevél hossza, a csészelevél szélessége, a csészelevél hossza, a csészelevél szélessége és a faj neve attribútumok. Az oszlopokat jellemzőknek nevezzük. Egy sorban az összes attribútum adatai szerepelnek. Ezért egy sort megfigyelésnek nevezünk. Az adatok lehetnek számszerűek vagy kategorikusak. A modell bemenetként megkapja a megfigyeléseket a megfelelő fajnévvel. Új megfigyelés esetén a modellnek meg kell jósolnia a faj típusát, amelyhez tartozik.
A felügyelt tanulásban vannak osztályozási és regressziós algoritmusok. Az osztályozás a címkézett adatok osztályozásának folyamata. A modell határokat hozott létre, amelyek elválasztották az adatkategóriákat. Amikor új adatot adnak meg a modellhez, az kategorizálhat az alapján, hogy hol található a pont. A K-Legközelebbi szomszédok (KNN) egy osztályozási modell. A k értéktől függően dől el a kategória. Például, ha k értéke 5, és egy adott adatpont közel van nyolc adatponthoz az A kategóriában és hat adatponthoz a B kategóriában, akkor az adatpont A kategóriába tartozik.
A regresszió az előző adatok trendjének előrejelzésének folyamata az új adatok kimenetelének előrejelzése érdekében. Regresszióban a kimenet egy vagy több folytonos változóból állhat. Az előrejelzés olyan vonal használatával történik, amely a legtöbb adatpontot lefedi. A legegyszerűbb regressziós modell a lineáris regresszió. Gyors, és nem igényel olyan hangolási paramétereket, mint a KNN-ben. Ha az adatok parabolikus trendet mutatnak, akkor a lineáris regressziós modell nem megfelelő.
Íme néhány példa a felügyelt tanulási algoritmusokra. Általában a felügyelt tanulási módszerekből származó eredmények pontosabbak és megbízhatóbbak, mivel a bemeneti adatok jól ismertek és címkézettek. Ezért a gépnek csak a rejtett mintákat kell elemeznie.
Mi az a felügyelet nélküli tanulás?
Felügyelet nélküli tanulás esetén a modell nem felügyelt. A modell önmagában működik, előrejelzi az eredményeket. Gépi tanulási algoritmusokat használ, hogy következtetéseket vonjon le a címkézetlen adatokról. Általában a felügyelt tanulási algoritmusok nehezebbek, mint a felügyelt tanulási algoritmusok, mivel kevés az információ. A klaszterezés a felügyelet nélküli tanulás egy fajtája. Alkalmazható az ismeretlen adatok csoportosítására algoritmusok segítségével. A k-átlag és a sűrűség alapú klaszterezés két klaszterezési algoritmus.
k-átlag algoritmus, minden klaszterhez véletlenszerűen helyez el k súlypontot. Ezután minden adatpont hozzá van rendelve a legközelebbi súlyponthoz. Az euklideszi távolság az adatpont és a súlypont közötti távolság kiszámítására szolgál. Az adatpontok csoportokba vannak sorolva. A k centroid pozícióit újra kiszámítja. Az új súlyponti pozíciót a csoport összes pontjának átlaga határozza meg. Ismét minden adatpont hozzá van rendelve a legközelebbi centroidhoz. Ez a folyamat addig ismétlődik, amíg a centroidok már nem változnak. A k-mean egy gyors klaszterezési algoritmus, de a klaszterezési pontoknak nincs meghatározott inicializálása. Ezenkívül a klaszterpontok inicializálásán alapuló klaszterezési modellek nagy változatosságot mutatnak.
Egy másik klaszterezési algoritmus a sűrűség alapú klaszterezés. Sűrűség alapú zajos térfürtözési alkalmazásokként is ismert. Úgy működik, hogy egy klasztert definiál a sűrűséghez kapcsolódó pontok maximális halmazaként. Ez két paraméter, amelyet a sűrűség alapú klaszterezéshez használnak. Ezek Ɛ (epsilon) és minimumpontok. Az Ɛ a környék legnagyobb sugara. A minimális pontok a minimális pontok száma a Ɛ szomszédságban a klaszter meghatározásához. Íme néhány példa a fürtözésre, amely a felügyelet nélküli tanulásba esik.
Általában a felügyelet nélküli tanulási algoritmusokból generált eredmények nem túl pontosak és megbízhatóak, mivel a gépnek meg kell határoznia és fel kell címkéznie a bemeneti adatokat, mielőtt meghatározná a rejtett mintákat és funkciókat.
Mi a hasonlóság a felügyelt és a nem felügyelt gépi tanulás között?
Mind a felügyelt, mind a nem felügyelt tanulás a gépi tanulás fajtái
Mi a különbség a felügyelt és a nem felügyelt gépi tanulás között?
Felügyelt vs nem felügyelt gépi tanulás |
|
A felügyelt tanulás a gépi tanulási feladat egy olyan függvény megtanulására, amely a bemenetet kimenetre képezi le példakénti bemenet-kimenet párok alapján. | A felügyelet nélküli tanulás a gépi tanulás feladata, hogy a címkézetlen adatokból rejtett struktúrát leíró függvényre következtessen. |
Fő funkciók | |
A felügyelt tanulás során a modell megjósolja az eredményt a címkézett bemeneti adatok alapján. | A felügyelet nélküli tanulás során a modell megjósolja az eredményt címkézett adatok nélkül azáltal, hogy önmagában azonosítja a mintákat. |
Az eredmények pontossága | |
A felügyelt tanulási módszerekből származó eredmények pontosabbak és megbízhatóbbak. | A felügyelet nélküli tanulási módszerekből származó eredmények nem túl pontosak és megbízhatóak. |
Fő algoritmusok | |
Léteznek regressziós és osztályozási algoritmusok a felügyelt tanulásban. | Léteznek algoritmusok a fürtözéshez a felügyelet nélküli tanulás során. |
Összefoglaló – Felügyelt és nem felügyelt gépi tanulás
A felügyelt tanulás és a felügyelet nélküli tanulás a gépi tanulás két típusa. A felügyelt tanulás a gépi tanulási feladat egy olyan függvény megtanulására, amely a bemenetet kimenetre képezi le példa bemenet-kimenet párok alapján. A felügyelet nélküli tanulás a gépi tanulási feladat, amelynek során a rejtett struktúrát leíró függvényre lehet következtetni a címkézetlen adatokból. A különbség a felügyelt és a nem felügyelt gépi tanulás között az, hogy a felügyelt tanulás címkézett adatokat használ, míg a felügyelet nélküli leaning címkézetlen adatokat.