WaveNet,由DeepMind创建的革命性合成声音

WaveNet

为了更好地理解什么是什么以及它是如何工作的, 合成声音 我想举一个明确的例子,肯定我们在某个时候碰到了所有事情,特别是我在谈论YouTube和其他互联网服务上出现的那些视频,其中叙述者通过 计算机产生的声音。 也许最著名,使用最广泛的阅读软件是 Loquendo 尽管今天的事实是这些系统已经发展了很多,但我们有证据表明 柯塔娜 o Siri.

今天,由 谷歌,以 路网 由部门的工程师创建的 DeepMind,一家人工智能公司,于2014年被Google收购。 复杂人工智能算法的语音合成软件 它起着复杂的神经系统的作用。

WaveNet,革命性的语音合成器,会让您大吃一惊

WayNet提出的新颖性中,应该指出的是,尽管到目前为止,使用的主要方法是 TTS,文字转语音,其中将不同的录制语音片段组合起来以构建单词和句子,或者称为 参数化TTS,一种将文本发送到语音编码器的方法,其结果比以前的编码结果更加不自然,我们现在发现WayNet不仅仅是合并和播放音频, 集成了一个能够学习和适应环境的复杂人工智能系统.

这个新系统能够执行 每秒16.000个样本 让您甚至无需人工干预即可生成自己的音频序列。 另一方面,值得一提的是,负责其开发的工程师已经引入了一种系统,该系统能够借助统计信息来预测以后将要说的内容,从而确保该系统能够更快,更流畅地提供结果。 如果您对WayNet感兴趣,请在其网站上告诉您 听英语和普通话的各种样本.

更多信息: DeepMind


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。