WaveNet, a nova voz sintética revolucionária criada por DeepMind

WaveNet

Para entender muito melhor o que é e como funciona, em linhas gerais, um sistema de voz sintética Quero me referir a um exemplo claro que certamente todos nós já encontramos em algum momento, especificamente estou falando sobre aqueles vídeos presentes no YouTube, bem como outros serviços da Internet onde o narrador fala através de um voz gerada por computador. Talvez o software de leitura mais conhecido e usado seja louco Embora hoje a verdade é que esses sistemas tenham evoluído muito, temos a prova em Cortana o Siri.

Hoje, o programa de síntese de voz mais recente e sofisticado apresentado por Google, um software conhecido pelo nome de Waynet e que foi criado pelos engenheiros pertencentes ao departamento DeepMind, uma empresa de inteligência artificial que foi adquirida pelo Google em 2014. A WayNet é uma software de síntese de voz baseado em algoritmos complexos de inteligência artificial que funciona como um sistema neural complexo.

WaveNet, um sintetizador de voz revolucionário que o surpreenderá

Dentre as novidades que a WayNet apresenta, cabe destacar que, embora até o momento o principal método utilizado tenha sido o TTS, texto para fala, onde diferentes fragmentos de fala gravados foram combinados para construir palavras e frases, ou conhecido como TTS paramétrico, um método que envia o texto para um codificador de voz cujos resultados são ainda menos naturais do que o anterior, agora encontramos que o WayNet, em vez de apenas combinar e reproduzir áudio, integra um sistema complexo de inteligência artificial que é capaz de aprender e se adaptar ao contexto.

Este novo sistema é capaz de realizar 16.000 amostras por segundo permitindo que você gere suas próprias sequências de áudio sem intervenção humana. Por outro lado, é importante mencionar que os engenheiros responsáveis ​​pelo seu desenvolvimento introduziram um sistema capaz de recorrer à estatística para prever o que terá a dizer posteriormente e assim garantir que o sistema ofereça resultados com muito mais rapidez e fluidez. Se você está interessado na WayNet, diga que no site dela você pode ouça vários exemplos em inglês e mandarim.

Mais informação: DeepMind


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.