WaveNet, noua voce sintetică revoluționară creată de DeepMind

WaveNet

Pentru a înțelege mult mai bine ce și cum funcționează, în linii mari, un sistem de voce sintetică Vreau să mă refer la un exemplu clar pe care cu siguranță l-am întâlnit cu toții la un moment dat, mai exact, vorbesc despre acele videoclipuri prezente pe YouTube, precum și despre alte servicii de internet în care naratorul vorbește printr-un voce generată de computer. Poate că cel mai cunoscut și cel mai utilizat software de citire este nebun Deși astăzi adevărul este că aceste sisteme au evoluat foarte mult, avem dovada Cortana o Siri.

Astăzi cel mai recent și sofisticat program de sinteză a vorbirii prezentat de Google, un software cunoscut sub numele de Waynet și care a fost creat de inginerii care aparțin departamentului DeepMind, o companie de inteligență artificială care a fost achiziționată de Google în 2014. WayNet este un software de sinteză a vorbirii bazat pe algoritmi complexi de inteligență artificială care funcționează ca un sistem neuronal complex.

WaveNet, un sintetizator de voce revoluționar care vă va surprinde

Printre noutățile pe care le prezintă WayNet, trebuie remarcat faptul că, deși până acum principala metodă utilizată a fost TTS, text în vorbire, unde diferite fragmente de vorbire înregistrate au fost combinate pentru a construi cuvinte și propoziții, sau cunoscute sub numele de TTS parametric, o metodă care trimite textul către un coder de vorbire ale cărui rezultate sunt chiar mai puțin naturale decât precedentul, acum găsim că WayNet, în loc să combină și să redea audio, integrează un sistem complex de inteligență artificială care este capabil să învețe și să se adapteze la context.

Acest nou sistem este capabil să funcționeze 16.000 de probe pe secundă permițându-vă chiar să generați propriile secvențe audio fără intervenția umană. Pe de altă parte, merită menționat faptul că inginerii responsabili de dezvoltarea sa au introdus un sistem capabil să recurgă la statistici pentru a prezice ce va trebui să spună mai târziu și astfel să se asigure că sistemul oferă rezultate mult mai rapid și mai fluid. Dacă sunteți interesat de WayNet, spuneți-vă că pe site-ul său web puteți ascultați diverse mostre în engleză și chineză mandarină.

Más și informare: DeepMind


Fii primul care comenteaza

Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Miguel Ángel Gatón
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.