Lietuvoje kuriamas įrankis, padedantis identifikuoti neapykantos kalbos atvejus internete

2021 m. lapkričio 29 d. 10:23
Internete vis gausėjant neapykantą kurstančių komentarų, į pagalbą ateina dirbtinis intelektas: Vytauto Didžiojo universiteto (VDU) mokslininkai kartu su Lietuvos žmogaus teisių centru, Europos žmogaus teisių fondu ir Tautinių mažumų departamentu prie Lietuvos Respublikos Vyriausybės kuria įrankį, kuris padės automatizuotai identifikuoti ir pašalinti neapykantos kalbos atvejus, pavyzdžiui, naujienų portalų komentarų skiltyse. Pasak vieno iš projekto vykdytojų, VDU Informatikos fakulteto dekano, profesoriaus Tomo Krilavičiaus, tokio įrankio kūrimas yra nemažas iššūkis: žmonėms ir patiems dažnai sunku atpažinti neapykantos kalbą, o dirbtinį intelektą reikia kruopščiai mokyti tai padaryti.
Daugiau nuotraukų (1)
„Universitete dirbdami su socialinių tinklų tekstais, komentarais pamatėme, kad ten daug negražių dalykų, neapykantos kurstymo. Tačiau atpažinti neapykantos kalbą dirbtiniam intelektui sudėtinga: gerų, efektyvių sprendimų šioje srityje iki šiol nėra pasiūlyta jokiai kalbai, kadangi net pats neapykantos kalbos apibrėžimas reikalauja atidžiai vertinti kontekstą. Be to, nėra aiškaus teisinio reguliavimo, ir žmonės patys kartais nesutaria, kas yra neapykantos kalba, o kas – ne“, – teigia profesorius.
Prof. T. Krilavičius pažymi, kad neapykantos kalba – tai ne bet koks prieš konkretų asmenį nukreiptas komentaras ar įžeidimas, o silpnesnių visuomenės grupių puolimas, pavyzdžiui, tautinių mažumų arba LGBT, grasinimai šioms grupėms. „Kitaip tariant, jei parašysite ką nors negražaus vien apie mane, tai nebus neapykantos kalba. Tačiau jeigu puolamos tam tikros nesaugios grupės, joms grasinama mušimu, naikinimu – tuomet taip“, – patikslina mokslininkas. Pasak jo, kuriamas neapykantos kalbos atpažinimo įrankis naudos dirbtinį intelektą ir kalbos technologijas tam, kad galėtų įvertinti tikimybę, jog konkretus tekstas yra neapykantos kalba.
Toks sprendimas galėtų būti ypač naudingas naujienų portalams, norintiems išlaikyti savo komentarų skiltis švarias. Šiuo metu mokslininkai tobulina įrankį, tam naudodami tekstų pavyzdžius, kad dirbtinis intelektas vėliau galėtų jais remtis vertindamas kitus atvejus. Orientuojamasi į trumpus tekstus, tokius kaip žinutės, komentarai, įrašai socialiniuose tinkluose. Projekto metu kuriant įrankį bendradarbiauja dirbtinio intelekto, technologijų, lingvistikos, teisės ir kitų sričių ekspertai.
„Pateikiame daug pavyzdžių, dalis jų pažymėta kaip neapykantos kalba, dalis – ne. Tokie dirbtinio intelekto sprendimai mokosi pagal pavyzdžius, žodžių kombinacijas. Naudojant sudėtingesnius metodus galima atpažinti, kad vietoj tam tikro žodžio gali būti pavartotas kitas – panašus, panašiame kontekste. Jau esame peržiūrėję daug metodų, eksperimentavome su mažu duomenų rinkiniu, dabar bandysime didesnį“, – pasakoja prof. T. Krilavičius.
Nors tikimasi, kad būsimas įrankis bus labai naudingas ir padės kovoti su neapykantos kalbos apraiškomis internete, tačiau profesorius tikina, jog dirbtinis intelektas tokiuose sprendimuose išlieka pagalbininkas žmogui ir jo nepakeis dar ilgai, nes čia labai svarbus kontekstas, papildomos žinios, pavyzdžiui, gebėjimas atpažinti sarkazmą. Taigi kai kuriais atvejais reikės, kad galimas neapykantos kalbos apraiškas įvertintų žmogus.
„Įrankis procentais nurodys tikimybę, kad analizuojamas tekstas yra neapykantos kalba. Pavyzdžiui, jei tikimybė sieks 70 procentų, komentaras bus automatiškai blokuojamas, o jeigu tik 50 procentų, tuomet publikuojamas. Tačiau jei tikimybė bus tarp 50 ir 70 procentų, tada komentaras bus laikinai blokuojamas ir perduodamas žmonėms patikrinti“, – sprendimo veikimo principą apibūdina profesorius.
Tarp pagrindinių iššūkių vystant įrankį – ne tik tai, kad kyla daug diskusijų dėl paties neapykantos kalbos apibrėžimo, bet ir nepakankamas kiekis pavyzdžių, iš kurių dirbtinis intelektas galėtų mokytis. „Neturime užtektinai tekstynų, sužymėtų pavyzdžių, o juos parengti yra didelis darbas. Be to, norint tuos dirbtinio intelekto modelius mokyti, reikia gana daug skaičiavimo resursų“, – sako prof. T. Krilavičius.
Kuriant įrankį buvo remtasi ir užsienio tyrimais bei sprendimais, daugiausia – anglų kalba. Vis dėlto, kaip matoma iš komentarų „Facebook“ ir kitose platformose, iki šiol pasaulyje nėra sprendimų, kurie galėtų efektyviai identifikuoti ir pašalinti neapykantos kalbą. Tikimasi, jog vystomas įrankis prisidės prie pažangos šioje srityje.
Prof. T. Krilavičius plačiau apie neapykantos kalbą diskutuos Nacionaliniame žmogaus teisių forume, vyksiančiame gruodžio 10 dieną Lietuvos nacionalinėje Martyno Mažvydo bibliotekoje. Diskusijoje „Neapykantos kalba: žmogus ir bendruomenė“ jis kartu su kitais renginio dalyviais aptars pastaruoju metu itin aktualius klausimus: kur yra riba tarp neapykantos kalbos ir žodžio laisvės, kaip technologijos padeda kovoti su neapykantos kalba ir kt. Diskusija yra projekto „Be Hate-Free: laisvų nuo neapykantos bendruomenių kūrimas Lietuvoje“ dalis.
Numatoma, kad Vytauto Didžiojo universiteto kartu su Lietuvos žmogaus teisių centru, Europos žmogaus teisių fondu ir Tautinių mažumų departamentu prie Lietuvos Respublikos Vyriausybės kuriamas neapykantos kalbos atpažinimo įrankis bus parengtas naudoti 2022 metų pavasarį. Projekte bendradarbiaujantys mokslininkai ne tik sukurs įrankį, bet ir parengs rekomendacijas, kaip jį naudoti, taip pat organizuos mokymus ir diskusijas, kurios padės atpažinti neapykantos kalbą, suprasti jos priežastis ir kilmę.

UAB „Lrytas“,
A. Goštauto g. 12A, LT-01108, Vilnius.

Įm. kodas: 300781534
Įregistruota LR įmonių registre, registro tvarkytojas:
Valstybės įmonė Registrų centras

lrytas.lt redakcija news@lrytas.lt
Pranešimai apie techninius nesklandumus pagalba@lrytas.lt

Atsisiųskite mobiliąją lrytas.lt programėlę

Apple App StoreGoogle Play Store

Sekite mus:

Visos teisės saugomos. © 2024 UAB „Lrytas“. Kopijuoti, dauginti, platinti galima tik gavus raštišką UAB „Lrytas“ sutikimą.