WaveNet, новы рэвалюцыйны сінтэтычны голас, створаны DeepMind

WaveNet

Каб значна лепш зразумець, што такое і як гэта працуе, шырокімі рысамі сістэмы сінтэтычны голас Я хачу звярнуцца да яскравага прыкладу, які, безумоўна, у нас у любы час сутыкаўся, у прыватнасці, я кажу пра відэа, прысутныя на YouTube, а таксама пра іншыя Інтэрнэт-сэрвісы, дзе апавядальнік выступае праз камп'ютэрны голас. Мабыць, самым вядомым і найбольш шырока ўжываным праграмным забеспячэннем для чытання з'яўляецца Локендо Хоць сёння ісціна ў тым, што гэтыя сістэмы значна эвалюцыянавалі, мы маем у гэтым доказ Кортана o Siri.

Сёння найноўшая і складаная праграма сінтэзу прамовы, прадстаўленая Google, праграмнае забеспячэнне, вядомае пад назвай WayNet і гэта было створана інжынерамі, якія ўваходзяць у аддзел Deepmind, кампанія, якая займаецца штучным інтэлектам, якая была набыта Google у 2014 годзе. WayNet з'яўляецца праграмнае забеспячэнне для сінтэзу прамовы на аснове складаных алгарытмаў штучнага інтэлекту які функцыянуе як складаная нервовая сістэма.

WaveNet, рэвалюцыйны сінтэзатар галасы, які вас здзівіць

Сярод навінак, якія прадстаўляе WayNet, варта адзначыць, што, хаця да гэтага часу асноўным метадам быў TTS, тэкст у маўленне, дзе розныя запісаныя фрагменты гаворкі спалучаліся для стварэння слоў і прапаноў, альбо вядомыя як Параметрычны TTS, метад, які адпраўляе тэкст на маўленчы код, вынікі якога нават менш натуральныя, чым папярэдні, зараз мы выяўляем, што WayNet, замест таго, каб проста камбінаваць і прайграваць аўдыё, інтэгруе складаную сістэму штучнага інтэлекту, здольную вучыцца і адаптавацца да кантэксту.

Гэтая новая сістэма здольная працаваць 16.000 узораў у секунду што дазваляе нават ствараць уласныя аўдыяпасляды без умяшання чалавека. З іншага боку, варта адзначыць, што інжынеры, якія адказваюць за яго распрацоўку, увялі сістэму, здольную звяртацца да статыстыкі, каб прадказаць, што ёй трэба будзе сказаць пазней, і такім чынам забяспечыць, каб сістэма давала вынікі значна хутчэй і цякчэй. Калі вы зацікаўлены ў WayNet, скажыце, што на яго сайце вы можаце слухаць розныя ўзоры на англійскай і кітайскай мовах.

Больш падрабязная інфармацыя: Deepmind


Змест артыкула адпавядае нашым прынцыпам рэдакцыйная этыка. Каб паведаміць пра памылку, націсніце тут.

Будзьце першым, каб каментаваць

Пакіньце свой каментар

Ваш электронны адрас не будзе апублікаваны. Абавязковыя для запаўнення палі пазначаныя *

*

*

  1. Адказны за дадзеныя: Мігель Анхель Гатон
  2. Прызначэнне дадзеных: Кантроль спаму, кіраванне каментарыямі.
  3. Легітымнасць: ваша згода
  4. Перадача дадзеных: Дадзеныя не будуць перададзены трэцім асобам, за выключэннем юрыдычных абавязкаў.
  5. Захоўванне дадзеных: База дадзеных, размешчаная Occentus Networks (ЕС)
  6. Правы: у любы час вы можаце абмежаваць, аднавіць і выдаліць сваю інфармацыю.