WaveNet, la nuova e rivoluzionaria voce sintetica creata da DeepMind

Wave Net

Per capire molto meglio cosa e come funziona, a grandi linee, un sistema di voce sintetica Voglio fare riferimento a un chiaro esempio che sicuramente tutti abbiamo incontrato prima o poi, nello specifico sto parlando di quei video presenti su YouTube e di altri servizi Internet in cui il narratore parla attraverso un voce generata dal computer. Forse il software di lettura più conosciuto e più utilizzato è Loquendo Anche se oggi la verità è che questi sistemi si sono evoluti molto, ne abbiamo la prova Cortana o Siri.

Oggi l'ultimo e sofisticato programma di sintesi vocale presentato da Google, un software noto con il nome di Waynet e che è stato creato dagli ingegneri del dipartimento DeepMind, una società di intelligenza artificiale acquisita da Google nel 2014. WayNet è un software di sintesi vocale basato su complessi algoritmi di intelligenza artificiale che funziona come un sistema neurale complesso.

WaveNet, un rivoluzionario sintetizzatore vocale che ti sorprenderà

Tra le novità che WayNet presenta, va notato che, sebbene fino ad ora il metodo principale utilizzato fosse il TTS, text to speech, in cui diversi frammenti di discorsi registrati sono stati combinati per creare parole e frasi, o noti come TTS parametrico, un metodo che invia il testo a un programmatore vocale i cui risultati sono ancora meno naturali del precedente, ora troviamo che WayNet, invece di combinare e riprodurre audio, integra un complesso sistema di intelligenza artificiale in grado di apprendere e adattarsi al contesto.

Questo nuovo sistema è in grado di funzionare 16.000 campioni al secondo permettendoti persino di generare le tue sequenze audio senza l'intervento umano. D'altra parte, vale la pena ricordare che gli ingegneri responsabili del suo sviluppo hanno introdotto un sistema in grado di ricorrere alla statistica per prevedere ciò che dovrà dire in seguito e garantire così che il sistema offra risultati molto più rapidi e fluidi. Se sei interessato a WayNet, ti dico che sul suo sito web puoi farlo ascolta vari campioni in inglese e cinese mandarino.

Per maggiori informazioni: DeepMind


Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

*

*

  1. Responsabile dei dati: Miguel Ángel Gatón
  2. Scopo dei dati: controllo SPAM, gestione commenti.
  3. Legittimazione: il tuo consenso
  4. Comunicazione dei dati: I dati non saranno oggetto di comunicazione a terzi se non per obbligo di legge.
  5. Archiviazione dati: database ospitato da Occentus Networks (UE)
  6. Diritti: in qualsiasi momento puoi limitare, recuperare ed eliminare le tue informazioni.