A WaveNet, a DeepMind által létrehozott, forradalmian új szintetikus hang

WaveNet

Sokkal jobban megérteni, hogy mi és hogyan működik, nagy vonalakban a rendszer szintetikus hang Szeretnék utalni egy világos példára, amellyel bizonyára valamennyien találkoztunk, konkrétan azokról a videókról beszélek a YouTube-on, valamint más internetes szolgáltatásokról, ahol az elbeszélő egy számítógép által generált hang. Talán a legismertebb és legszélesebb körben használt olvasó szoftver őrült Bár ma az az igazság, hogy ezek a rendszerek sokat fejlődtek, a bizonyíték bennünk van Cortana o Siri.

Ma a legújabb és legkifinomultabb beszédszintézis programot mutatja be Google, név alatt ismert szoftver Waynet és ezt az osztályhoz tartozó mérnökök hozták létre DeepMind, egy mesterséges intelligencia céget, amelyet a Google 2014-ben vásárolt meg. A WayNet a komplex mesterséges intelligencia algoritmusokon alapuló beszédszintézis szoftver amely komplex idegrendszerként funkcionál.

A WaveNet, egy forradalmi hangszintetizátor, amely meg fog lepni

A WayNet által bemutatott újdonságok közül meg kell jegyezni, hogy bár eddig a fő módszer a TTS, szövegről beszédre, ahol különböző rögzített beszédtöredékeket egyesítettek szavak és mondatok építéséhez, vagy más néven Parametrikus TTS, egy olyan módszer, amely a szöveget elküldi egy beszédkódolónak, amelynek eredményei még kevésbé természetesek, mint az előző, most azt a WayNet-t találjuk, ahelyett, hogy csak kombinálnánk és lejátszanánk a hangot, integrál egy komplex mesterséges intelligencia rendszert, amely képes tanulni és alkalmazkodni a kontextushoz.

Ez az új rendszer képes teljesíteni Másodpercenként 16.000 XNUMX minta lehetővé téve, hogy emberi beavatkozás nélkül akár saját audiosorozatait is létrehozhassa. Másrészt érdemes megemlíteni, hogy a fejlesztéséért felelős mérnökök olyan rendszert vezettek be, amely képes statisztikák felhasználására, hogy megjósolja a későbbi mondanivalóját, és így biztosítsa, hogy a rendszer sokkal gyorsabban és gördülékenyebben kínáljon eredményeket. Ha érdekli a WayNet, mondja el, hogy a weboldalán megteheti hallgasson meg különféle mintákat angolul és kínaiul.

További információ: DeepMind


Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: Miguel Ángel Gatón
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.