WaveNet, la nova i revolucionària veu sintètica creada per DeepMind

WaveNet

Per entendre molt millor què és i com funciona, a grans trets, un sistema de veu sintètica vull remetre'm a un exemple clar amb què segur que tots ens hem topat alguna vegada, concretament parlo d'aquests vídeos presents a YouTube així com d'altres serveis d'internet on el narrador parla mitjançant una veu generada per ordinador. Potser el programari de lectura més conegut i utilitzat sigui Loquendo encara que avui la veritat és que aquests sistemes han evolucionat moltíssim, la prova la tenim a Cortana o Siri.

Avui és notícia el darrer i sofisticat programa de síntesi de veu presentat per google, un programari que es coneix sota el nom de WayNet i que ha estat creat pels enginyers pertanyents al departament DeepMind, una companyia d'intel·ligència artificial que va ser adquirida per Google l'any 2014. WayNet és un programari de síntesi de veu basat en complexos algorismes d'intel·ligència artificial que funciona com un complex sistema neuronal.

WaveNet, un revolucionari sintetitzador de veu que us sorprendrà

Entre les novetats que presenta WayNet, cal destacar que, si bé fins ara el principal mètode utilitzat era el TTS, text a veu, on es combinaven diferents fragments de veu gravats per construir paraules i oracions, o el conegut com TTS paramètric, un mètode que envia el text a un codificador de veu els resultats del qual són fins i tot menys naturals que l'anterior, ara ens trobem que WayNet, en lloc de limitar-se a combinar i reproduir àudio, integra un sistema d'intel·ligència artificial complex que és capaç d'aprendre i adaptar-se al context.

Aquest nou sistema és capaç de realitzar 16.000 mostrejos per segon la qual cosa us permet arribar fins i tot a generar les vostres pròpies seqüències d'àudio sense intervenció humana. D'altra banda, cal esmentar que els enginyers responsables del seu desenvolupament han introduït un sistema capaç de recórrer a l'estadística per predir el que haurà de dir després i així aconseguir que el sistema ofereixi resultats de manera molt més ràpida i fluida. Si estàs interessat en WayNet, comentar-te que a la seva pàgina web es poden escoltar diverses mostres en anglès i xinès mandarí.

Més informació: DeepMind


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.