„Microsoft“ teksto vertimo į kalbą sistema per tris sekundes gali nukopijuoti balsą ir įgarsinti tekstą

2023 m. sausio 31 d. 14:11
Lrytas.lt
Nuo pat pirmojo teksto vertimo į kalbą (angl. text-to-speech, TTS) modelio išleidimo mokslininkai ieškojo būdų, kaip patobulinti šių sistemų kalbos generavimo būdą. Naujausias „Microsoft“ modelis „VALL-E“ šiuo požiūriu yra reikšmingas žingsnis į priekį, pasakoja futurologas Rayus Hammondas.
Daugiau nuotraukų (1)
„VALL-E“ – tai TTS modelis, kuris gali generuoti kalbą bet kokiu balsu, „išgirdęs“ vos trijų sekundžių to balso pavyzdį. Tai didelis patobulinimas, palyginus su ankstesniais modeliais, kuriems reikėjo daug ilgesnio mokymo laikotarpio, kad būtų galima sukurti naują balsą.
Be to, generuojamoje kalboje išlieka balso intonacija, „charizma“ ir stilius. Tai svarbus žingsnis į priekį siekiant, kad TTS sistemos skambėtų natūraliau.
Kompanija „Microsoft“ paskelbė keletą veikiančio modelio pavyzdžių – ir akivaizdu, kad tai yra didelė pažanga TTS technologijose.

UAB „Lrytas“,
A. Goštauto g. 12A, LT-01108, Vilnius.

Įm. kodas: 300781534
Įregistruota LR įmonių registre, registro tvarkytojas:
Valstybės įmonė Registrų centras

lrytas.lt redakcija news@lrytas.lt
Pranešimai apie techninius nesklandumus pagalba@lrytas.lt

Atsisiųskite mobiliąją lrytas.lt programėlę

Apple App StoreGoogle Play Store

Sekite mus:

Visos teisės saugomos. © 2024 UAB „Lrytas“. Kopijuoti, dauginti, platinti galima tik gavus raštišką UAB „Lrytas“ sutikimą.