WaveNet,由DeepMind創建的革命性合成聲音

WaveNet

為了更好地理解什麼是什麼以及它是如何工作的, 合成聲音 我想參考一個明確的例子,我們肯定會在某個時候碰到過,特別是我在談論YouTube和其他互聯網服務上出現的那些視頻,其中敘述者通過 計算機產生的聲音。 也許最著名,使用最廣泛的閱讀軟件是 洛昆多 儘管今天的事實是這些系統已經發展了很多,但我們有證據表明 柯塔娜 o Siri的.

今天,由 谷歌,以 路網 由部門的工程師創建的 DeepMind,一家人工智能公司,於2014年被Google收購。 複雜人工智能算法的語音合成軟件 它起著複雜的神經系統的作用。

WaveNet,革命性的語音合成器,會讓您大吃一驚

WayNet提出的新穎性中,應該指出的是,儘管到目前為止,使用的主要方法是 TTS,文本到語音,其中將不同的錄製語音片段組合起來以構建單詞和句子,或者稱為 參數化TTS,一種將文本發送到語音編碼器的方法,其結果比以前的編碼結果更加不自然,我們現在發現WayNet不僅僅是合併和播放音頻, 集成了一個能夠學習和適應環境的複雜人工智能係統.

這個新系統能夠執行 每秒16.000個樣本 讓您甚至無需人工干預即可生成自己的音頻序列。 另一方面,值得一提的是,負責其開發的工程師已經引入了一種系統,該系統能夠借助統計信息來預測以後將要說的內容,從而確保該系統能夠更快,更流暢地提供結果。 如果您對WayNet感興趣,請在其網站上告訴您 聽英語和普通話的各種樣本.

更多信息: DeepMind


發表您的評論

您的電子郵件地址將不會被發表。 必填字段標有 *

*

*

  1. 負責數據:MiguelÁngelGatón
  2. 數據用途:控制垃圾郵件,註釋管理。
  3. 合法性:您的同意
  4. 數據通訊:除非有法律義務,否則不會將數據傳達給第三方。
  5. 數據存儲:Occentus Networks(EU)託管的數據庫
  6. 權利:您可以隨時限制,恢復和刪除您的信息。