WaveNet, revolucionarni novi sintetički glas koji je stvorio DeepMind

WaveNet

Da bismo puno bolje razumjeli što i kako djeluje, širokim potezima, sustava sintetički glas Želim se osvrnuti na jasan primjer koji smo sigurno svi naišli u neko vrijeme, konkretno govorim o onim videozapisima koji su prisutni na YouTubeu, kao i o drugim internetskim uslugama gdje pripovjedač govori putem računalno generirani glas. Možda najpoznatiji i najčešće korišten softver za čitanje je lud Iako je danas istina da su se ti sustavi puno razvili, mi imamo dokaz u tome Cortana o Siri.

Danas najnoviji i sofisticirani program sinteze govora koji je predstavio Google, softver poznat pod imenom Waynet a to su stvorili inženjeri koji pripadaju odjelu DeepMind, tvrtka za umjetnu inteligenciju koju je Google stekao 2014. WayNet je softver za sintezu govora temeljen na složenim algoritmima umjetne inteligencije koji funkcionira kao složeni živčani sustav.

WaveNet, revolucionarni sintetizator glasa koji će vas iznenaditi

Među novitetima koje WayNet predstavlja, valja napomenuti da, iako je do sada glavna metoda koja se koristila bila TTS, tekst u govor, gdje su različiti zabilježeni fragmenti govora kombinirani za izgradnju riječi i rečenica, ili poznati kao Parametarski TTS, metoda koja šalje tekst govornom koderu čiji su rezultati čak i manje prirodni od prethodnog, sada nalazimo da WayNet, umjesto samo kombiniranja i reprodukcije zvuka, integrira složeni sustav umjetne inteligencije koji je sposoban učiti i prilagoditi se kontekstu.

Ovaj novi sustav je sposoban za izvedbu 16.000 XNUMX uzoraka u sekundi omogućujući vam čak i generiranje vlastitih audio sekvenci bez ljudske intervencije. S druge strane, vrijedi spomenuti da su inženjeri odgovorni za njegov razvoj uveli sustav sposoban pribjeći statistici kako bi predvidio što će morati reći kasnije i tako osigurati da sustav nudi rezultate mnogo brže i fluidnije. Ako ste zainteresirani za WayNet, recite vam da na njegovom web mjestu možete slušajte razne uzorke na engleskom i mandarinskom kineskom.

Više informacija: DeepMind


Ostavite svoj komentar

Vaša email adresa neće biti objavljen. Obavezna polja su označena s *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obvezi.
  5. Pohrana podataka: Baza podataka koju hostira Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.