WaveNet, революційний новий синтетичний голос, створений DeepMind

WaveNet

Щоб набагато краще зрозуміти, що і як це працює, широкими штрихами, система синтетичний голос Я хочу звернутися до наочного прикладу, який, безумовно, ми всі стикалися з часом, зокрема, я говорю про відео, присутні на YouTube, а також про інші Інтернет-послуги, де оповідач виступає через комп'ютерний голос - -. Мабуть, найвідомішим та найбільш широко використовуваним програмним забезпеченням для читання є Loquendo Хоча сьогодні правда полягає в тому, що ці системи значно еволюціонували, ми маємо в цьому підтвердження Кортан o Siri.

Сьогодні остання та досконала програма синтезу мовлення, представлена Google, програмне забезпечення під назвою Вейнет і це було створено інженерами, що належать до відділу Deepmind, компанія зі штучного інтелекту, придбана Google у 2014 році. WayNet є програмне забезпечення для синтезу мовлення на основі складних алгоритмів штучного інтелекту який функціонує як складна нервова система.

WaveNet, революційний синтезатор голосу, який здивує вас

Серед новинок, які представляє WayNet, слід зазначити, що хоча дотепер основним методом був TTS, текст до мови, де різні записані фрагменти голосу поєднувались для побудови слів та речень, або відомі як Параметричний TTS, метод, який надсилає текст кодеру мови, результати якого навіть менш природні, ніж попередній, тепер ми виявляємо, що WayNet, замість того, щоб просто комбінувати та відтворювати звук, інтегрує складну систему штучного інтелекту, яка здатна навчатися та адаптуватися до контексту.

Ця нова система здатна працювати 16.000 зразків в секунду що дозволяє навіть генерувати власні аудіопослідовності без участі людини. З іншого боку, варто згадати, що інженери, відповідальні за її розробку, запровадили систему, здатну вдаватися до статистики, щоб передбачити, що вона повинна буде сказати пізніше, і таким чином забезпечити, щоб система пропонувала результати набагато швидше та плавніше. Якщо вас цікавить WayNet, повідомте, що на його веб-сайті ви можете слухати різні зразки англійською та мандаринською мовами.

посилання Deepmind


Будьте першим, щоб коментувати

Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Мігель Анхель Гатон
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.