WaveNet, den revolutionerande nya syntetiska rösten skapad av DeepMind

WaveNet

Att förstå mycket bättre vad som är och hur det fungerar, i stora drag, ett system av syntetisk röst Jag vill hänvisa till ett tydligt exempel som vi säkert alla har stött på någon gång, särskilt jag pratar om de videor som finns på YouTube och andra internettjänster där berättaren talar genom en datorgenererad röst. Kanske är den mest kända och mest använda läsningsprogrammet Loquendo Även om sanningen idag är att dessa system har utvecklats mycket, har vi beviset i Cortana o Siri.

Idag presenterades det senaste och sofistikerade talsyntesprogrammet av Google, en programvara som är känd under namnet Waynet och det har skapats av ingenjörerna som tillhör avdelningen Deepmind, ett företag med artificiell intelligens som förvärvades av Google 2014. WayNet är ett mjukvara för talsyntes baserad på komplexa algoritmer för artificiell intelligens som fungerar som ett komplext neuralt system.

WaveNet, en revolutionerande röstsynthesizer som kommer att överraska dig

Bland de nyheter som WayNet presenterar bör det noteras att, även om den hittills huvudsakliga metoden var TTS, text till tal, där olika inspelade talfragment kombinerades för att skapa ord och meningar, eller kallas Parametrisk TTS, en metod som skickar texten till en talkodare vars resultat är ännu mindre naturliga än den tidigare, vi hittar nu att WayNet istället för att bara kombinera och spela upp ljud, integrerar ett komplext system för artificiell intelligens som kan lära sig och anpassa sig till sammanhanget.

Detta nya system kan prestera 16.000 XNUMX prover per sekund så att du till och med kan skapa dina egna ljudsekvenser utan mänsklig inblandning. Å andra sidan är det värt att nämna att ingenjörerna som ansvarar för dess utveckling har infört ett system som kan tillgripa statistik för att förutsäga vad det kommer att säga senare och därmed få systemet att erbjuda resultat mycket snabbare och smidigare. Om du är intresserad av WayNet, berätta att du kan göra det på webbplatsen lyssna på olika exempel på engelska och mandarin.

Más información: Deepmind


Bli först att kommentera

Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för uppgifterna: Miguel Ángel Gatón
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.