Padės atlikti įvairius veiksmus
Po „ChatGPT“ išpopuliarėjimo daugelis jau įprato klausti patarimų ne tik „Google“ paieškos, bet ir įvairių dideliais kalbos modeliais (angl. „Large Language Models“, LLM) pagrįstų pokalbių robotų. Vis dėlto, jie turi vieną didelį apribojimą – gali patarti, bet dažnu atveju veiksmą atlikti teks patiems. Tai pakeisti ruošiasi DI agentų kūrėjai, žadantys, kad jų dirbtinis intelektas galės ne tik plepėti, bet ir daryti.
„Technologijų pasaulyje DI agentai yra viena garsiausių pastarojo pusmečio temų. Jei dabar DI galiu paprašyti suplanuoti trijų dienų kelionę viename ar kitame mieste pagal mano pageidavimus, DI agentas tokiu atveju galėtų pats ir parinkti skrydžio bilietus, juos užsakyti. Tai jau galime matyti ankstyvose DI agentų bandomosiose versijose. Užduodi užklausą, pakeli rankas nuo klaviatūros ir ekrane stebi, kaip kompiuteryje atidarinėjamos ir uždarinėjamos programos, daromi užsakymai“, – sako L. Keraitis.
Anot eksperto, šiuo metu galima stebėti tik panašių automatizacijų užuomazgas klientų aptarnavimo, duomenų analizės ar kitose srityse, taip pat programavime. Tačiau kol kas dar nėra universalaus, eilines žmogaus užduotis atlikti galinčio DI agento.
„Vienu metu šioje srityje ir vyksta evoliucija, ir laukiama revoliucijos. Evoliuciją galima stebėti teksto įrankiuose. „Gmail“ jau dabar siūlo užbaigti tavo sakinius už tave. Išbandžiau kitą mažo startuolio programėlę, kuri rašo už tave bet kurioje kompiuterio programoje. Veikia, tačiau tikrai ne taip kokybiškai, kad galėčiau naudoti kasdien. Yra „ChatGPT“ programėlių (angl. „GPT‘s“) galinčių sugeneruoti prezentacijos skaidres. Jos iš tiesų primityviai tai padaro, tačiau paprašius jas pataisyti pagal pastabas, atrėžia – pats ir pasitaisyk. Tad tobulėti dar tikrai yra kur“, – pastebi L. Keraitis.
Veiktų ir telefonuose
Pasak eksperto, prieš porą metų dauguma DI įrankių veikė vienu formatu – tekstu, paveikslėliais ar garsu. Pastaruoju metu matoma vis daugiau multimodališkumo – to paties įrankio gebėjimo ir redaguoti tekstą, ir generuoti paveikslėlį, ir suprasti balsą. Tai labai svarbu kuriant DI agentus.
Kitas artimas iššūkis – leisti DI agentams suprasti skirtingas telefonų ar kompiuterių programėles, valdyti jas savarankiškai. „Idealiu atveju telefonas su DI agentu sugebėtų savarankiškai „vaikščioti“ tarp mano programėlių, suprastų, kad skaičiavimus noriu atlikti skaičiuotuve, o planus sudėti į kalendorių“, – tikina L. Keraitis.
Dauguma dabartinių pokalbių robotų veikia debesijoje – tam, kad rastų geriausią atsakymą, jiems reikia internetu prisijungti prie savo serverių. Be to, atsakymams generuoti reikalingi didžiuliai skaičiavimo galios resursai. Todėl stengiamasi sutalpinti šiuos modelius į vis mažesnius įrenginius, net asmeninius kompiuterius ar telefonus. Tokiu principu veikiantys DI agentai galėtų efektyviau įdarbinti naudotojo asmeninius duomenis – analizuojant juos telefono viduje kyla mažiau saugumo iššūkių.
DI agentai kuriami, bet dar teks palaukti
Nors „Siri“ ar kitas asistentas gali iškviesti taksi ar rasti norimą nupirkti knygą, DI agentas galėtų pats palyginti kelis internetinius knygynus, rasti geriausią variantą, knygą nupirkti, rasti artimiausią paštomatą ir nukreipti užsakymą į jį.
L. Keraičio manymu, tokia ateities vizija kelia klausimų apie internetinį saugumą ir atsakomybę – kas nutiks, jei DI agentas „prisidirbs“ naudotojo vardu? Pavyzdžiui, jei žmogus parsisiųs kenkėjišką agentą ir prijungs prie jo mokėjimo kortelę? Galų gale – ar tikėtina, kad visi turės savo DI dublerius, kurie derins tarpusavio susitikimus, siųs ir skaitys laiškus, galbūt net atstovaus žmones pasimatymuose ar biurokratiniuose reikaluose?
„Turint omenyje, kad technologinis DI agentų įgyvendinimas tampa vis lengviau įsivaizduojamas, o technologijų kompanijos supranta, kokį pranašumą įgautų pirmieji pasiūlę tokį produktą, belieka laukti šios konkurencijos rezultatų“, – sako L. Keraitis.