WaveNet, la nueva y revolucionaria voz sintética creada por DeepMind

WaveNet

Para entender mucho mejor qué es y como funciona, a grandes rasgos, un sistema de voz sintética quiero remitirme a un ejemplo claro con el que seguro todos nos hemos topado alguna vez, concretamente hablo de esos vídeos presentes en YouTube así como de otros servicios de internet donde el narrador habla mediante una voz generada por ordenador. Quizá l software de lectura más conocido y utilizado sea Loquendo aunque hoy la verdad es que estos sistemas han evolucionado muchísimo, la prueba la tenemos en Cortana o Siri.

Hoy es noticia el último y sofisticado programa de síntesis de voz presentado por Google, un software que se conoce bajo el nombre de WayNet y que ha sido creado por los ingenieros pertenecientes al departamento DeepMind, una compañía de inteligencia artificial que fue adquirida por Google en el año 2014. WayNet es un software de síntesis de voz basado en complejos algoritmos de inteligencia artificial que funciona como un complejo sistema neuronal.

WaveNet, un revolucionario sintetizador de voz que te sorprenderá

Entre las novedades que presenta WayNet, destacar que, si bien hasta ahora el principal método utilizado era el TTS, texto a voz, donde se combinaban diferentes fragmentos de voz grabados para construir palabras y oraciones, o el conocido como TTS paramétrico, un método que envía el texto a un codificador de voz cuyos resultados son incluso menos naturales que el anterior, ahora nos encontramos con que WayNet, en lugar de limitarse a combinar y reproducir audio, integra un complejo sistema de inteligencia artificial que es capaz de aprender y adaptarse al contexto.

Este nuevo sistema es capaz de realizar 16.000 muestreos por segundo lo que le permite llegar incluso a generar sus propias secuencias de audio sin intervención humana. Por otro lado, mencionar que los ingenieros responsables de su desarrollo han introducido un sistema capaz de recurrir a la estadística para predecir lo que tendrá que decir después y así conseguir que el sistema ofrezca resultados de forma mucho más rápida y fluida. Si estás interesado en WayNet, comentarte que en su página web se pueden escuchar varias muestras en inglés y chino mandarín.

Más información: DeepMind


Sé el primero en comentar

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.