Nors neaišku, kaip ten viskas iš tiesų veikia „po gaubtu“, „Figure“ pasirašė komercinę sutartį su BMW dėl savo humanoidinių robotų naudojimo automobilių gamyboje – apie tai pranešė sausio 18 d. pranešime spaudai.
Ekspertai įvertino, kas greičiausiai vyksta „po gaubtu“ – darant prielaidą, kad filmuotoje medžiagoje matyti būtent tai, ką teigia bendrovė.
Šiuo metu dirbtiniu intelektu (DI) varoma robotika yra pritaikyta konkrečiai sričiai, t. y. šios mašinos gerai atlieka vieną dalyką, o ne viską. Jos pradeda nuo užprogramuotų bazinių taisyklių ir duomenų rinkinio, naudojamo apsimokymui – tačiau „Figure.ai“ tvirtina, kad „Figure 01“ apsimokė vien peržiūrėjęs 10 valandų filmuotos medžiagos.
Kad robotas galėtų gaminti kavą arba pjauti veją, reikėtų sukaupti žinias keliose srityse, kurias tiksliai užprogramuoti būtų per daug sudėtinga. Reikėtų numatyti ir į programinę įrangą įkoduoti visų įmanomų nenumatytų atvejų taisykles – pavyzdžiui, konkrečius nurodymus, ką daryti, kai robotas pasieks vejos galą. Todėl įgyti patirties daugelyje sričių vien tik žiūrint skamba kaip didelis šuolis.
Naujojo tipo robotika
Pirmoji dėlionės dalis yra ta, kad „Figure 01“ turi matyti, ką jis turi kartoti. „Informacijos apdorojimas vizualiai leidžia jam atpažinti svarbius proceso etapus ir detales“, – teigia dirbtinio intelekto verslininkas ir vienas iš „AI Product Reviews“ savininkų Maxas Maybury.
Robotui reikia paimti vaizdo duomenis ir sukurti vidinį nuspėjamąjį fizinių veiksmų modelį bei veiksmų eiliškumą, sako svetainės AIPRM, kuri kuria užklausas (angl. prompts), įvedamas į tokias AI sistemas kaip „ChatGPT“, generalinis direktorius Christophas Cemperis. Jis nurodo, kad tai, ką robotas mato, turi paversti supratimu, kaip judinti galūnes ir griebtuvus, kad atliktų tuos pačius judesius.
Pasak duomenų analizės ir dirbtinio intelekto ekspertės iš Analitikos instituto Jungtinėje Karalystėje Clare Walsh, neuroninių tinklų architektūra – tai mašininio mokymosi modelis, sukurtas pagal smegenų veikimo principą. Didelis skaičius tarpusavyje sujungtų atskirų mazgų jungiasi, kad sukurtų signalą. Jei norimas rezultatas, kai signalai nulemia veiksmą (pavyzdžiui, rankos ištiesimą ar sučiupimą griebtuvu) pasiekiamas, grįžtamasis ryšys sustiprina jį pasiekusias neuronų jungtis, toliau įtvirtindamas jį „žinomuose“ procesuose.
„Maždaug iki 2016 m. objektų atpažinimo – pavyzdžiui, nuotraukose atpažįstant kates ir šunis – sėkmės rodikliai siekdavo apie 50 proc. Kai neuroniniai tinklai buvo ištobulinti, rezultatai beveik per naktį šoktelėjo iki 80–90 proc. – apsimokymas stebint, taikant patikimą mokymosi metodą, neįtikėtinai gerai paplito“, – sako C. Walsh.
Jos nuomone, egzistuoja panašumai tarp „Figure 01“ ir autonominių transporto priemonių, – ir tai atsirado dėl tikimybinių, o ne taisyklėmis pagrįstų mokymo metodų. Ji pažymėjo, kad savarankiškai mokantis galima pakankamai greitai sukurti duomenis, kad būtų galima dirbti sudėtingoje aplinkoje.
Kodėl savikorekcija yra svarbus pasiekimas
Nepaisant to, kad daugumai žmonių kavą pasigaminti yra lengva, mašinai išmokti ir atlikti motorines funkcijas, tikslias manipuliacijas ir pritaikyti įvykių eiliškumo žinias yra neįtikėtinai sudėtinga. Todėl gebėjimas savarankiškai ištaisyti klaidas yra labai svarbus – ypač jei „Figure 01“ nuo kavos gaminimo pereis prie sunkių objektų kėlimo šalia žmonių arba gelbėjimo darbų.
„Roboto regos gerumas neapsiriboja vien tuo, kad jis mato, kas vyksta kavos gaminimo procese, – pasakoja M. Maybury. – Jis ne tik stebi, bet ir analizuoja procesą, kad užtikrintų, jog viskas būtų kuo tiksliau“.
Tai reiškia, kad robotas žino, kaip neperpildyti puodelio ir kaip teisingai įdėti kapsulę. Jei jis pastebi kokį nors nukrypimą nuo išmokto elgesio ar laukiamų rezultatų, jis tai supranta kaip klaidą ir tikslina savo veiksmus, kol pasiekia norimą rezultatą. Jis tai daro mokydamasis pastiprinimo būdu (angl. reinforcement learning), kai norimo tikslo suvokimas ugdomas bandant ir klystant, kai dirbama neapibrėžtoje aplinkoje.
C. Walsh priduria, kad tinkami mokymo duomenys reiškia, jog roboto judesiai, panašūs į žmogaus, gali būti greitai „plečiami ir įvairinami“. „Judesių skaičius yra įspūdingas, o tikslumas ir savikorekcijos galimybės reiškia, kad tai gali tapti šios srities vystymosi pranašumu“, – sako ji.
Tačiau dirbtinio intelekto ekspertė, įgijusi daktaro laipsnį natūralios kalbos apdorojimo srityje įgijusi DI ekspertė Mona Kirstein įspėją, kad „Figure 01“ atrodo kaip puikus pirmas žingsnis, bet ne rinkai paruoštas produktas.
„Norint pasiekti žmogaus lygio lankstumą naujuose kontekstuose, neapsiribojant šia siaurai apibrėžta užduotimi, dar reikia išspręsti tokias kliūtis kaip aplinkos svyravimus, – sako specialistė. – Taigi, nors tai ir sujungia puikią inžineriją su naujausiu giluminiu mokymusi, greičiausiai pažanga pervertinama – jei visa tai vertinama kaip visuotinai protingo humanoidinio roboto sukūrimas“
Parengta pagal „Live Science“.