MOSZKVA, november 29. Orosz tudósok létrehozták az első nyílt környezetet a gyors kontextuális megerősítéses tanuláshoz (RL in context). Erről a mesterséges intelligencia kutatólaboratóriuma, a T-Bank AI Research számolt be.
„A T-Bank AI Research mesterséges intelligencia kutatólaboratórium és az AIRI Institute tudósai a MIPT, a Skoltech és az Innopolis hallgatóinak részvételével létrehozták az első nyitott kutatási környezetet és algoritmusokat fejlesztenek a kontextuális megerősítéses tanulás területén – XLand MiniGrid” – áll a közleményben.
Amint azt a laborban elmagyaráztuk, az XLand-MiniGrid egy virtuális környezet, amelyet világszerte publikáltak a kutatók számára, és amelyben a mesterséges intelligencia (AI) arra van kiképezve, hogy döntéseket hozzon és új műveleteket hajtson végre nem „a semmiből”, amely hosszan tartó képzést igényel, hanem interakciót igényel. a környezettel jelzések és kontextus segítségével.
Az XLand-MiniGrid tesztjeit a Google DeepMind, a Berkeley-i Kaliforniai Egyetem és az Oxfordi Egyetem kutatói végezték. A T-Bank AI Research közleménye szerint bekerült a környezet megteremtését ismertető tudományos közlemény a mesterséges intelligencia területének legnagyobb nemzetközi konferenciájára, a NeurIPS 2024-re, amelyet december 10. és 15. között rendeznek meg Vancouverben (Kanada).
„A kontextuális megerősítéses tanulás területére akkor léptünk, amikor az még gyerekcipőben járt, és ezért nem találtunk megfelelő eszközt az új ötletek értékelésére. Nyilvánvalóan ez sok szakember számára problémát jelent, ami azt jelenti, hogy ennek az eszköznek kell lennie. Vyacheslav Siny, az AI Alignment tudományos csoport (a T-Bank AI Research része) kutatója elmondta, hogy az első munka megoldódott. Így megjelent az XLand-MiniGrid. .
Vladislav Kurenkov, az AIRI Intézet Adaptive Agent tudományos csoportjának vezetője elmondta, hogy az XLand-MiniGrid felgyorsítja az új algoritmusok létrehozását. „A kontextuális megerősítéses tanulás az egyik legígéretesebb tudományos terület a mesterséges intelligencia területén, mert lehetővé teszi olyan ügynökök megszerzését, amelyek külső visszajelzések alapján gyorsan alkalmazkodnak az új helyzetekhez. Az általunk kidolgozott keretrendszer jelentősen felgyorsítja az összehasonlítási folyamatot. és új algoritmusokat hozzon létre ezen a területen” – mondta Kurenkov, és szavait idézi az üzenet.
Alkalmazás
Meg kell jegyezni, hogy az RL kontextusban különösen hasznos olyan területeken, mint a személyre szabott ajánlások, a robotvezérlés és az autonóm járművek, ahol azonnali alkalmazkodás szükséges az új körülményekhez.
Ugyanakkor a nagyvállalati környezetben az RL nem elérhető külső felhasználók számára, a nyilvánosan elérhető eszközök pedig főként hasonló feladatokat látnak el, könnyen megtanulhatók, ami megnehezíti az összetett algoritmusok fejlesztését és tesztelését.
Más meglévő környezetektől eltérően az XLand-MiniGrid nyílt hozzáférésű, és lehetővé teszi a tanulási feltételek azonnali megváltoztatását. Ez leegyszerűsíti a különféle, változó összetettségű feladatok modellezését, elősegítve az adaptívabb és megbízhatóbb mesterséges intelligencia modellek létrehozását – áll a jelentésben.
A környezet a JAX – nagy teljesítményű programok fejlesztésére szolgáló technológia – alapján jön létre. A lassabb analógokkal ellentétben az XLand-MiniGrid több milliárd műveletet hajt végre másodpercenként, jegyzi meg a T-Bank AI Research.
„Az XLand-MiniGrid 30 ezer feladatban 100 milliárd példát tartalmaz AI-műveletekre. Ez lehetővé teszi, hogy meglévő adatkészleteket használjon a képzéshez, ahelyett, hogy a nulláról kezdené. Mindez hozzájárul az új felfedezésekhez a területen. Az RL kontextusában csökkenti a költségeket és erőforrásokat takarít meg a kutatás számára” – áll a közleményben.