Pentru a înțelege mult mai bine ce și cum funcționează, în linii mari, un sistem de voce sintetică Vreau să mă refer la un exemplu clar pe care cu siguranță l-am întâlnit cu toții la un moment dat, mai exact, vorbesc despre acele videoclipuri prezente pe YouTube, precum și despre alte servicii de internet în care naratorul vorbește printr-un voce generată de computer. Poate că cel mai cunoscut și cel mai utilizat software de citire este nebun Deși astăzi adevărul este că aceste sisteme au evoluat foarte mult, avem dovada Cortana o Siri.
Astăzi cel mai recent și sofisticat program de sinteză a vorbirii prezentat de Google, un software cunoscut sub numele de Waynet și care a fost creat de inginerii care aparțin departamentului DeepMind, o companie de inteligență artificială care a fost achiziționată de Google în 2014. WayNet este un software de sinteză a vorbirii bazat pe algoritmi complexi de inteligență artificială care funcționează ca un sistem neuronal complex.
WaveNet, un sintetizator de voce revoluționar care vă va surprinde
Printre noutățile pe care le prezintă WayNet, trebuie remarcat faptul că, deși până acum principala metodă utilizată a fost TTS, text în vorbire, unde diferite fragmente de vorbire înregistrate au fost combinate pentru a construi cuvinte și propoziții, sau cunoscute sub numele de TTS parametric, o metodă care trimite textul către un coder de vorbire ale cărui rezultate sunt chiar mai puțin naturale decât precedentul, acum găsim că WayNet, în loc să combină și să redea audio, integrează un sistem complex de inteligență artificială care este capabil să învețe și să se adapteze la context.
Acest nou sistem este capabil să funcționeze 16.000 de probe pe secundă permițându-vă chiar să generați propriile secvențe audio fără intervenția umană. Pe de altă parte, merită menționat faptul că inginerii responsabili de dezvoltarea sa au introdus un sistem capabil să recurgă la statistici pentru a prezice ce va trebui să spună mai târziu și astfel să se asigure că sistemul oferă rezultate mult mai rapid și mai fluid. Dacă sunteți interesat de WayNet, spuneți-vă că pe site-ul său web puteți ascultați diverse mostre în engleză și chineză mandarină.
Más și informare: DeepMind