Ang WaveNet, ang rebolusyonaryong bagong synthetic na tinig na nilikha ng DeepMind

WaveNet

Upang maunawaan nang mas mabuti kung ano at paano ito gumagana, sa malawak na stroke, isang sistema ng gawa ng tao boses Nais kong mag-refer sa isang malinaw na halimbawa na tiyak na lahat tayo ay nakatagpo ng ilang oras, partikular na pinag-uusapan ko ang mga video na nasa YouTube pati na rin ang iba pang mga serbisyo sa internet kung saan nagsasalita ang tagapagsalaysay sa pamamagitan ng isang boses na binuo ng computer. Marahil ang pinakamahusay na kilala at pinakalawak na ginagamit na software ng pagbabasa ay baliw Bagaman ngayon ang totoo ay ang mga sistemang ito ay umunlad ng marami, mayroon kaming katibayan sa Cortana o Siri.

Ngayon ang pinakabago at sopistikadong programa sa pagbubuo ng pagsasalita na ipinakita ni Google, isang software na pinupunta sa pangalan ng Waynet at iyon ay nilikha ng mga inhinyero na kabilang sa kagawaran Deepmind, isang artipisyal na kumpanya ng intelihensiya na nakuha ng Google noong 2014. Ang WayNet ay isang software synthesis ng pagsasalita batay sa mga kumplikadong artipisyal na algorithm ng talino na gumaganap bilang isang komplikadong neural system.

WaveNet, isang rebolusyonaryo na synthesizer ng boses na sorpresahin ka

Kabilang sa mga novelty na ipinakita ng WayNet, dapat pansinin na, kahit na hanggang ngayon ang pangunahing pamamaraan na ginamit ay ang TTS, teksto sa pagsasalita, kung saan ang magkakaibang naitala na mga fragment ng boses ay pinagsama upang makabuo ng mga salita at pangungusap, o kilala bilang Parametric TTS, isang pamamaraan na nagpapadala ng teksto sa isang tagapagsalita ng coder na ang mga resulta ay hindi gaanong natural kaysa sa naunang isa, nahanap namin ngayon ang WayNet, sa halip na pagsamahin lamang at pag-play ng audio, nagsasama ng isang kumplikadong artipisyal na sistema ng katalinuhan na may kakayahang matuto at umangkop sa konteksto.

Ang bagong sistemang ito ay may kakayahang gumanap 16.000 mga sample bawat segundo na pinapayagan kang lumikha ng iyong sariling mga pagkakasunud-sunod ng audio nang walang interbensyon ng tao. Sa kabilang banda, sulit na banggitin na ang mga inhinyero na responsable para sa pagpapaunlad nito ay nagpakilala ng isang sistemang may kakayahang gumamit ng mga istatistika upang mahulaan kung ano ang sasabihin nito sa paglaon at sa gayon ay matiyak na ang system ay nag-aalok ng mga resulta nang mas mabilis at mahusay. Kung interesado ka sa WayNet, sabihin sa iyo na sa website nito magagawa mo makinig sa iba`t ibang mga halimbawa sa Ingles at Mandarin na Tsino.

Higit pang impormasyon: Deepmind


Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: Miguel Ángel Gatón
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.