Daug geriau suprasti, kas yra ir kaip tai veikia, plačiau tariant, sistemos sintetinis balsas Noriu paminėti aiškų pavyzdį, su kuriuo tikrai visi susidūrėme tam tikru metu, būtent aš kalbu apie tuos „YouTube“ vaizdo įrašus ir kitas interneto paslaugas, kur pasakotojas kalba per kompiuteriu sukurtas balsas. Bene geriausiai žinoma ir plačiausiai naudojama skaitymo programinė įranga pamišusi Nors šiandien tiesa ta, kad šios sistemos yra labai evoliucionavusios, mes turime įrodymą Cortana o "Siri".
Šiandien pristatoma naujausia ir sudėtingiausia balso sintezės programa "Google", programinė įranga, žinoma kaip „WayNet“ ir tai sukūrė katedrai priklausantys inžinieriai DeepMind, dirbtinio intelekto įmonė, kurią „Google“ įsigijo 2014 m. „WayNet“ yra kalbos sintezės programinė įranga, pagrįsta sudėtingais dirbtinio intelekto algoritmais kuri veikia kaip kompleksinė nervų sistema.
„WaveNet“, revoliucinis balso sintezatorius, kuris jus nustebins
Tarp naujovių, kurias pateikia WayNet, reikia pažymėti, kad, nors iki šiol pagrindinis naudojamas metodas buvo TTS, tekstas į kalbą, kur įvairūs įrašyti balso fragmentai buvo sujungti, kad būtų sukurti žodžiai ir sakiniai, arba žinomi kaip Parametrinė TTS, metodas, siunčiantis tekstą į kalbos koderį, kurio rezultatai yra dar mažiau natūralūs nei ankstesnis, dabar mes nustatome, kad „WayNet“, užuot tik sujungę ir groję garsą, integruoja sudėtingą dirbtinio intelekto sistemą, gebančią mokytis ir prisitaikyti prie konteksto.
Ši nauja sistema gali veikti 16.000 XNUMX mėginių per sekundę leidžiantis net generuoti savo garso sekas be žmogaus įsikišimo. Kita vertus, verta paminėti, kad inžinieriai, atsakingi už jos plėtrą, įdiegė sistemą, galinčią pasinaudoti statistika, kad numatytų, ką ji turės pasakyti vėliau, ir taip užtikrins, kad sistema pasiūlytų rezultatus daug greičiau ir sklandžiau. Jei jus domina „WayNet“, pasakykite tai savo interneto svetainėje klausytis įvairių pavyzdžių anglų ir kinų k.
Daugiau informacijos: DeepMind