WaveNet, новият революционен синтетичен глас, създаден от DeepMind

WaveNet

За да разберем много по-добре какво и как работи, най-общо казано, система от синтетичен глас Искам да се позова на ясен пример, че със сигурност всички сме се сблъсквали в даден момент, по-специално говоря за тези видеоклипове, присъстващи в YouTube, както и за други интернет услуги, при които разказвачът говори компютърно генериран глас. Може би най-известният и най-широко използван софтуер за четене е Локендо Въпреки че днес истината е, че тези системи са се развили много, ние имаме доказателство за това Кортана o Siri.

Днес най-новата и усъвършенствана програма за синтез на реч, представена от Google, софтуер, известен под името Уейнет и това е създадено от инженерите, принадлежащи към отдела DeepMind, компания за изкуствен интелект, придобита от Google през 2014 г. WayNet е софтуер за синтез на реч, базиран на сложни алгоритми за изкуствен интелект който функционира като сложна невронна система.

WaveNet, революционен синтезатор на глас, който ще ви изненада

Сред новостите, които WayNet представя, трябва да се отбележи, че въпреки че досега основният използван метод беше TTS, текст към реч, където различни записани речеви фрагменти са комбинирани за изграждане на думи и изречения или известни като Параметричен TTS, метод, който изпраща текста към речев кодер, чиито резултати са дори по-малко естествени от предишния, сега откриваме, че WayNet, вместо просто да комбинира и възпроизвежда аудио, интегрира сложна система за изкуствен интелект, която е способна да учи и да се адаптира към контекста.

Тази нова система може да работи 16.000 XNUMX проби в секунда което ви позволява дори да генерирате свои собствени аудио последователности без човешка намеса. От друга страна, заслужава да се спомене, че инженерите, отговорни за нейното разработване, са въвели система, способна да прибегне до статистика, за да предскаже какво ще трябва да каже по-късно и по този начин да гарантира, че системата предлага резултати много по-бързо и плавно. Ако се интересувате от WayNet, кажете, че на уебсайта му можете слушайте различни мостри на английски и мандарин китайски.

За повече информация: DeepMind


Бъдете първите, които коментират

Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.