Sokkal jobban megérteni, hogy mi és hogyan működik, nagy vonalakban a rendszer szintetikus hang Szeretnék utalni egy világos példára, amellyel bizonyára valamennyien találkoztunk, konkrétan azokról a videókról beszélek a YouTube-on, valamint más internetes szolgáltatásokról, ahol az elbeszélő egy számítógép által generált hang. Talán a legismertebb és legszélesebb körben használt olvasó szoftver őrült Bár ma az az igazság, hogy ezek a rendszerek sokat fejlődtek, a bizonyíték bennünk van Cortana o Siri.
Ma a legújabb és legkifinomultabb beszédszintézis programot mutatja be Google, név alatt ismert szoftver Waynet és ezt az osztályhoz tartozó mérnökök hozták létre DeepMind, egy mesterséges intelligencia céget, amelyet a Google 2014-ben vásárolt meg. A WayNet a komplex mesterséges intelligencia algoritmusokon alapuló beszédszintézis szoftver amely komplex idegrendszerként funkcionál.
A WaveNet, egy forradalmi hangszintetizátor, amely meg fog lepni
A WayNet által bemutatott újdonságok közül meg kell jegyezni, hogy bár eddig a fő módszer a TTS, szövegről beszédre, ahol különböző rögzített beszédtöredékeket egyesítettek szavak és mondatok építéséhez, vagy más néven Parametrikus TTS, egy olyan módszer, amely a szöveget elküldi egy beszédkódolónak, amelynek eredményei még kevésbé természetesek, mint az előző, most azt a WayNet-t találjuk, ahelyett, hogy csak kombinálnánk és lejátszanánk a hangot, integrál egy komplex mesterséges intelligencia rendszert, amely képes tanulni és alkalmazkodni a kontextushoz.
Ez az új rendszer képes teljesíteni Másodpercenként 16.000 XNUMX minta lehetővé téve, hogy emberi beavatkozás nélkül akár saját audiosorozatait is létrehozhassa. Másrészt érdemes megemlíteni, hogy a fejlesztéséért felelős mérnökök olyan rendszert vezettek be, amely képes statisztikák felhasználására, hogy megjósolja a későbbi mondanivalóját, és így biztosítsa, hogy a rendszer sokkal gyorsabban és gördülékenyebben kínáljon eredményeket. Ha érdekli a WayNet, mondja el, hogy a weboldalán megteheti hallgasson meg különféle mintákat angolul és kínaiul.
További információ: DeepMind