WaveNet, den revolusjonerende nye syntetiske stemmen opprettet av DeepMind

WaveNet

Å forstå mye bedre hva som er og hvordan det fungerer, i store trekk, et system av syntetisk stemme Jeg vil referere til et klart eksempel som vi alle har kommet over på en gang, spesielt jeg snakker om videoene som er tilstede på YouTube, så vel som andre internettjenester der fortelleren snakker gjennom datagenererte stemme. Kanskje den mest kjente og mest brukte leseprogramvaren er Loquendo Selv om sannheten i dag er at disse systemene har utviklet seg mye, har vi beviset i Cortana o Siri.

I dag er det siste og sofistikerte talesyntese-programmet presentert av Google, en programvare kjent under navnet Waynet og det er skapt av ingeniørene som tilhører avdelingen DeepMind, et kunstig intelligensfirma som ble kjøpt opp av Google i 2014. WayNet er en talesyntese programvare basert på komplekse kunstige intelligens algoritmer som fungerer som et komplekst nevralt system.

WaveNet, en revolusjonerende stemmesynthesizer som vil overraske deg

Blant nyhetene som WayNet presenterer, bør det bemerkes at, til nå var den viktigste metoden som ble brukt TTS, tekst til tale, der forskjellige innspilte talefragmenter ble kombinert for å bygge ord og setninger, eller kjent som Parametrisk TTS, en metode som sender teksten til en talekoder hvis resultater er enda mindre naturlige enn den forrige, finner vi nå at WayNet, i stedet for bare å kombinere og spille av lyd, integrerer et komplekst kunstig intelligenssystem som er i stand til å lære og tilpasse seg konteksten.

Dette nye systemet kan utføre 16.000 XNUMX prøver per sekund slik at du til og med kan generere dine egne lydsekvenser uten menneskelig inngripen. På den annen side er det verdt å nevne at ingeniørene som er ansvarlige for utviklingen, har introdusert et system som er i stand til å ty til statistikk for å forutsi hva det vil si senere og dermed sikre at systemet gir resultater mye raskere og flytende. Hvis du er interessert i WayNet, fortell deg at du kan gjøre det på nettstedet lytte til forskjellige eksempler på engelsk og mandarin-kinesisk.

Mer informasjon: DeepMind


Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.