„Šis tyrimas yra novatoriškas bandymas paversti neapdorotas smegenų bangas tiesiogiai į kalbą, o tai yra reikšmingas proveržis šioje srityje“, – sakė UTS Kompiuterių mokslo įstaigos profesorius ir „GrapheneX-UTS“ HAI centro direktorius Chingas-Tenas Linas.
Tyrime dalyviai mintyse skaitė teksto ištraukas, o dirbtinio intelekto modelis, pavadintas „DeWave“, naudodamas tik jų smegenų bangas kaip įvesties duomenis, rodė tekstą ekrane.
Nors tai nėra pirmoji technologija, galinti paversti smegenų signalus į kalbą, kol kas tai vienintelė technologija, kuriai nereikia nei smegenų implantų, nei prieigos prie magnetinio rezonanso (MRT) aparato. Be to, mokslininkai teigia, kad ši technologija yra pranašesnė už ankstesnes, kurioms reikia papildomų duomenų, pavyzdžiui, akių judesių sekimo programinės įrangos, nes naujoji technologija gali būti naudojama su tokiais papildomais įrenginiais arba be jų.
Naudotojams tereikia dėvėti kepuraitę, kuri elektroencefalograma (EEG) fiksuoja jų smegenų veiklą – tai daug praktiškiau ir patogiau nei akių judesių sekimo įranga (jau nekalbant apie MRT aparatą). Tiesa, tyrėjai pripažino, kadsignalas buvo šiek tiek prastesnis nei iš implantų, tačiau ši technologija veikė gana gerai. Atlikus tikslumo matavimus pagal BLEU (bilingual evaluation understudy) algoritmą, naujosios technologijos tikslumas buvo apie 0,4 balo. Kai kurios kitos technologijos, kurios priklauso nuo invazyvesnių metodų, yra tikslesnės.
„Modelis geriau sugeba atrinkti veiksmažodžius nei daiktavardžius, – paaiškino vienas iš straipsnio autorių Yiqunas Duanas, – „o kalbant apie daiktavardžius, pastebėjome tendenciją rinktis sinonimines poras, o ne tikslius vertimus, pavyzdžiui, „žmogus“ vietoj „autorius“. Manome, kad [šios klaidos] atsiranda todėl, kad smegenims apdorojant žodžius, semantiškai panašūs žodžiai gali sukelti panašius smegenų bangų modelius.“
Tačiau tyrėjai mano, kad dirbtinio intelekto modelio tikslumą gali padidinti iki 0,9 – tai yra lygis, prilygstantis tradicinėms kalbų vertimo programoms. Jie tiki, kad jau dabar turi pranašumą, nes savo bandymus atliko su 29 dalyviais.
„Nepaisant iššūkių, mūsų modelis duoda prasmingų rezultatų – suderina raktinius žodžius ir formuoja panašias sakinių struktūras“, – sakė Y. Duanas.
Tyrimo rezultatai publikuojami svetainėje „ArXiV“.
Parengta pagal „IFL Science“.