Para entender muito melhor o que é e como funciona, em linhas gerais, um sistema de voz sintética Quero me referir a um exemplo claro que certamente todos nós já encontramos em algum momento, especificamente estou falando sobre aqueles vídeos presentes no YouTube, bem como outros serviços da Internet onde o narrador fala através de um voz gerada por computador. Talvez o software de leitura mais conhecido e usado seja louco Embora hoje a verdade é que esses sistemas tenham evoluído muito, temos a prova em Cortana o Siri.
Hoje, o programa de síntese de voz mais recente e sofisticado apresentado por Google, um software conhecido pelo nome de Waynet e que foi criado pelos engenheiros pertencentes ao departamento DeepMind, uma empresa de inteligência artificial que foi adquirida pelo Google em 2014. A WayNet é uma software de síntese de voz baseado em algoritmos complexos de inteligência artificial que funciona como um sistema neural complexo.
WaveNet, um sintetizador de voz revolucionário que o surpreenderá
Dentre as novidades que a WayNet apresenta, cabe destacar que, embora até o momento o principal método utilizado tenha sido o TTS, texto para fala, onde diferentes fragmentos de fala gravados foram combinados para construir palavras e frases, ou conhecido como TTS paramétrico, um método que envia o texto para um codificador de voz cujos resultados são ainda menos naturais do que o anterior, agora encontramos que o WayNet, em vez de apenas combinar e reproduzir áudio, integra um sistema complexo de inteligência artificial que é capaz de aprender e se adaptar ao contexto.
Este novo sistema é capaz de realizar 16.000 amostras por segundo permitindo que você gere suas próprias sequências de áudio sem intervenção humana. Por outro lado, é importante mencionar que os engenheiros responsáveis pelo seu desenvolvimento introduziram um sistema capaz de recorrer à estatística para prever o que terá a dizer posteriormente e assim garantir que o sistema ofereça resultados com muito mais rapidez e fluidez. Se você está interessado na WayNet, diga que no site dela você pode ouça vários exemplos em inglês e mandarim.
Mais informação: DeepMind