PTE MIK

A robotika hosszú évek óta foglalkozik az életünk megkönnyítésével, azonban az AI fejlődésével ez a kutatási ág is egy új fejezethez érkezett. Évtizedekig az számított alapvetésnek, hogy egy robot csak annyira okos, amennyire a konkrét feladatára felkészítették. Példának okáért egy robotporszívó teljesen használhatatlan, ha konyhai feladatok ellátásáról van szó. Korábban a robotok univerzális felhasználása csupán a sci-fi filmekben és a mesékben létezett, azonban a technológia fejlődése egyre közelebb kerül a megvalósításukhoz. 

Az általános felhasználású robotok fejlesztése a robotika egyik legnagyobb kihívása. Egy feladatspecifikus robot fejlesztésekor a fejlesztők rengeteg adatot gyűjtenek, mely kontrollált környezetet és sok időt igényel. Továbbá a fejlesztés rendkívül költséges, és a robotok nehezen alkalmazkodnak az új helyzetekhez.

Az MIT kutatói erre kifejlesztett technológiája képes különböző érzékelőkből és képi forrásokból származó adatokat egységes rendszerbe rendezni. A módszer lényege, hogy a sokféle adatot egy közös „nyelvvé” alakítja, így a robot egyszerre képes képi adatokból, különböző érzékelők által gyűjtött adatokból és mozgásból tanulni. Ennek köszönhetően a robotok szélesebb feladatkörre taníthatók anélkül, hogy minden új feladat esetén a nulláról kellene kezdeni a tanítást.

A robotok tanításának hagyományos módja az imitációs tanulás volt, ahol emberi bemutatásokból vagy távvezérléssel gyűjtött adatokból tanultak. Ennek hátránya, hogy kevés és feladatspecifikus mintát adnak, így a robotok könnyen hibáznak új környezetben. A kutatók ezért a nagy nyelvi modellek felől közelítették meg a problémát. Hatalmas és sokféle adatot egyesítettek egy közös tudásbázisban, melyből a robot általánosságban tud tanulni. A rendszer középpontjában egy transformer modell áll, mely képes minden bemenő adatot egységes formára alakítani, ezzel egyre jobbá válni, ahogy több adattal találkozik. Így a felhasználónak csak nagyon kevés saját adatot kell megadnia, a modell pedig a korábbi tudását felhasználva gyorsan megtanítja a robotot az új feladatra.

A modell legnagyobb fejlesztési kihívása az óriási adatbázis létrehozása volt. A kutatók 4 adatkategóriát használtak, az emberi demonstrációs videók, a valós robotok által végrehajtott mozgások, szimulációs adatok és a különböző robotplatformokról származó szenzoradatok. A modellnek köszönhetően több mint 20%-os teljesítménynövekedést értek el valós robotokon, és akkor is növekedést értek el, ha a feladat nagyon eltért a betanítási adatoktól. Továbbá képessé tette a különböző robotok közötti tudásmegosztást.

Az általános felhasználású robotika jövője egyre közelebb kerül. Az MIT fejlesztése és a hozzá hasonló kutatások nagyban hozzájárulnak a robotika fejlődéséhez, és az univerzális robotagy kifejlesztéséhez. Ez teljesen új szintre emelheti az autonóm rendszerek képességeit.

Források:
https://arxiv.org/pdf/2409.20537
https://news.mit.edu/2024/training-general-purpose-robots-faster-better-1028

By kissv

Hasonló cikkek