Mélytanulás + gépi látás

A felügyeleti rendszerek következő generációja

2019. november 27., szerda, 06:00

Címkék: cognex felügyeleti szoftver gépi látás gépi tanulás mesterséges intelligencia szenzor szenzortechnika

A gépi látás és a mélytanulás kombinációja erős alapot ad a vállalatoknak mind az operatív működés, mind a befektetésarányos megtérülés vonatkozásában. A beruházások megtérülésének maximalizálása szempontjából elengedhetetlen tehát a hagyományos gépi látás és a mélytanulás közötti különbségek felkutatása, valamint annak megértése, hogy ezek a technológiák kiegészítik egymást – nem pedig versenyeznek egymással, vagy helyettesítik egymást. Jelen cikk ezt a kérdéskört hivatott tisztázni.

Az elmúlt évtizedben a technológia változásai és fejlesztései sokrétűek voltak: eszközmobilitás… big data… mesterséges intelligencia (AI)… A dolgok internete… robotika… blokklánc… 3D nyomtatás… gépi látás… Mindezek az újdonságok azért kerültek ki a K+F laboratóriumokból, hogy mindennapi életünket javítsák.

A mérnökök szeretik a technológiákat alkalmazni, és adaptálni azokat az ipari környezetekhez és korlátokhoz. Ezen technológiák egy részének vagy mindegyikének átvételére és kihasználására vonatkozó stratégiai tervezés kulcsfontosságúvá vált a feldolgozóiparban.

Fókuszáljunk most a mesterséges intelligenciára és a mélytanulásra épülő képanalízisre vagy a példákon alapuló gépi látásra. A hagyományos, szabályalapú gépi látásmóddal kombinálva az AI segíthet a robotizált összeszerelő egységeknek a megfelelő alkatrészek azonosításában, felismerheti, hogy egy alkatrész hiányzik-e, vagy nem megfelelően van-e felszerelve a termékre, és gyorsabban meghatározhatja, hogy ezek problémát jelentenek-e. Mindezt rendkívül nagy pontossággal.

Először nézzük meg, mi a mélytanulás

Anélkül, hogy túlságosan belemennénk a részletekbe, beszéljünk a GPU hardverről. A GPU-k (grafikus feldolgozóegységek) ezernyi viszonylag egyszerű feldolgozómagot gyűjtenek össze egyetlen csipbe. Felépítésük az ideghálózatokhoz hasonlít. Lehetővé teszik a biológiai ihletésű és többrétegű „mély” ideghálózatok telepítését, amelyek az emberi agyat utánozzák.

Egy ilyen architektúra alkalmazásával a mélytanulás lehetővé teszi konkrét feladatok megoldását anélkül, hogy kifejezetten arra programozták volna. Más szavakkal: a klasszikus számítógépes alkalmazásokat az emberek úgy programozzák, hogy azok „feladat-specifikusak” legyenek, míg a mélytanulás adatokat (képeket, beszédeket, szövegeket, számokat stb.) használ, és idegi hálózatokon keresztül képezi le azokat. Az alapképzés során kifejlesztett elsődleges logikától kezdve a mély idegi hálózatok folyamatosan finomítják teljesítményüket, amint új adatokat kapnak.

Ez a koncepció a különbségek felismerésén alapszik: tartósan vizsgálja az adatkészlet változásait és szabálytalanságait. Érzékeny, és reagál a kiszámíthatatlan hibákra. Az emberek minderre evolúciós okokból kiválóak. A merev programozáson alapuló számítógépes rendszerek azonban nem jók ebben (de a gyártósorok emberi ellenőreivel ellentétben a számítógépek nem fáradnak el, ha állandóan ugyanazt az iterációt végzik).

A mindennapi életben a mélytanulás tipikus alkalmazásai az arcfelismerés (a számítógépek feloldásához vagy az emberek fotókon történő azonosításához)… ajánlási motorok (a videó- és zeneszolgáltatások közvetítéséhez vagy az e-kereskedelemhez)… spamszűrés e-mailekben… betegségdiagnosztika… hitelkártyacsalások felderítése…

A mélytanulás technológiája nagyon pontos eredményeket ad a képzett adatok alapján. Használják a minták előrejelzésére, a varianciák és rendellenességek észlelésére, valamint a kritikus üzleti döntések meghozatalára. Ugyanez a technológia mostantól a fejlett gyártási gyakorlatokban jelenik meg a minőség-ellenőrzés és az egyéb, döntéshozatalon alapuló alkalmazások esetében.

A hagyományos gépi látás és a mélytanulás közötti nagy különbségek a következők: 1. A fejlesztési folyamat (eszközönként szabályalapú programozás vs. példaalapú képzés); 2. Hardverbefektetések (a mélytanulás több feldolgozási és tárolási kapacitást igényel); 3. A gyári automatizálás használati esetei

A megfelelő típusú gyári környezetben történő alkalmazás esetén, a gépi látáshoz kapcsolódóan a mélytanulás növeli a gyártás nyereségességét (különösen más feltörekvő technológiákba történő beruházásokkal összehasonlítva, amelyeknél éveket vehet igénybe a megtérülés).

Hogyan egészíti ki a mélytanulás a gépi látást?

A gépi látórendszer egy digitális érzékelőn alapul, amelyet egy speciális optikával ellátott ipari kamerába helyeznek. A rendszer képeket készít, amelyeket egy számítógépre továbbítanak. A döntéshozatalhoz a specializált szoftverfolyamatok elemzéseket készítenek, és különféle jellemzőket mérnek. A gépi látásrendszerek megbízhatóan teljesítenek a következetesen és megfelelően gyártott alkatrészek esetében. Lépésről lépésre történő szűréssel és szabályalapú algoritmusokkal működnek.

Egy gyártósoron a szabályokon alapuló gépi látórendszer percenként száz vagy akár több ezer alkatrészt is ellenőrizhet nagy pontossággal. Költséghatékonyabb, mint az emberi ellenőrzés. A vizuális adatok kimenete programozási, szabályalapú megközelítésen alapul az ellenőrzési problémák megoldására.

A gyártóterülethez a hagyományos, szabályokon alapuló gépi látás az ideális: irányításhoz (pozicionálás, tájolás…), azonosításhoz (vonalkódok, datmátrix kódok, jelek, karakterek…), méréshez (a távolságok a megadott értékekkel történő összehasonlítása…), ellenőrzéshez (hibák és egyéb problémák, például hiányzó biztonsági pecsét, törött alkatrész…).

A hagyományos gépi látáshoz képest a mélytanulás: 1. Nehezen megoldható alkalmazásokhoz tervezték; 2. Könnyebben konfigurálható; 3. Toleráns a variációkkal szemben

A szabályalapú gépi látás az ismert változókészlettel kiváló eredményekhez vezet: Megvan egy alkatrész, vagy hiányzik? Pontosan milyen messze van ez az objektum a másiktól? Hol kell ennek a robotnak felvennie ezt az alkatrészt? Ezeket a feladatokat könnyű teljesíteni egy futószalagon, ellenőrzött környezetben. De mi történik, ha a dolgok nem olyan világosak?

Itt lép be a játékba a mélytanulás:

  • Megoldás azon visionalkalmazások esetében, amelyeket szabályalapú algoritmusokkal túl nehéz programozni.
  • Kezeli a zavaró háttereket és az alkatrész-megjelenítésben mutatkozó eltéréseket.
  • Karbantartja az alkalmazásokat, és az üzem új képadataival továbbképzi önmagát.
  • Az alaphálózatok újraprogramozása nélkül alkalmazkodik az új példákhoz.

Egy tipikus ipari példa: karcolások keresése az elektronikus eszközök képernyőjén. Ezek a hibák eltérőek lehetnek mind méretüket, terjedelmüket, helyzetüket vagy a különböző háttérrel rendelkező képernyőkön történő megjelenésüket tekintve. Az ilyen variációk figyelembevételével a mélytanulás megmutatja a különbséget a jó és a hibás termékek között. Ráadásul a hálózat új célokra (például másfajta képernyőre) történő betanítása ugyanolyan egyszerű, mint egy új referenciakép készítése.

A vizuálisan hasonló, bonyolult felületi textúrájú és változatos megjelenésű eltérések ellenőrzése komoly kihívást jelent a hagyományos szabályalapú gépi látórendszerek számára. A „funkcionális”, a felhasználhatóságot befolyásoló hibákat szinte mindig kiszűrik, de ez nem feltétlenül igaz a „kozmetikai” rendellenességek esetében, amelyek már a gyártó igényeitől és preferenciáitól függenek. Sőt mi több: ezeket a hibákat a hagyományos gépi látórendszer is nehezen különbözteti meg.

Egy tipikus ipari példa: eltérő méretű, alkalmazási körű, elhelyezkedésű vagy különböző háttérrel rendelkező felületeken lévő hibák keresése

Számos olyan tényező miatt, amelyeket nehezen lehet egymástól elkülöníteni (világítás, színváltozások, görbület vagy látómező), néhány hibadetektálást közismerten nehéz programozni és megoldani egy hagyományos gépi látórendszerrel. Ilyenkor jelent megoldást a mélytanulás.

Röviden: a hagyományos gépi látórendszerek megbízhatóan működnek az egységes és megfelelően gyártott alkatrészek esetében, viszont a bonyolultabb programozást igénylő feladatoknál, és a lehetséges hibafaktorok számának növekedésekor nehézségekbe ütközik a hagyományos módszer. Az olyan összetett helyzetekben, amelyekben az emberéhez hasonló látást igényel a számítógép sebessége és megbízhatósága, a mélytanulás valóban képes megváltoztatni a játékszabályokat.

A mélytanulás előnyei az ipari gyártásban

A szabályalapú gépi látás és a mélytanuláson alapuló képanalízis kiegészítik egymást, nem pedig vagy-vagy lehetőségként működnek a következő generációs gyári automatizálási eszközök adaptálásakor. Egyes alkalmazásokban, például a méréstechnikában a szabályalapú gépi látás továbbra is az előnyben részesített és költséghatékony választás. A nagy eltéréseket és kiszámíthatatlan hibákat magában foglaló összetett ellenőrzésekhez – amelyek túl bonyolultak a hagyományos gépi látórendszerben történő programozáshoz és karbantartáshoz – kiváló alternatívát jelentenek a mélytanulásra épülő eszközök.

 

www.cognex.com/ViDi-deep-learning

Keresés
Bejelentkezés / Regisztráció
Austria transfers

Média Partnerek