WaveNet, revolucionārā jaunā sintētiskā balss, ko radījis DeepMind

WaveNet

Lai daudz labāk saprastu, kas ir un kā tas darbojas, ar plašu skatu - sintētiska balss Es gribu atsaukties uz skaidru piemēru, ar kuru, protams, mēs visi zināmā laikā esam saskārušies, es runāju tieši par tiem videoklipiem, kas atrodas vietnē YouTube, kā arī par citiem interneta pakalpojumiem, kur stāstītājs runā caur datora ģenerēta balss. Varbūt vispazīstamākā un visplašāk izmantotā lasīšanas programmatūra ir Lokendo Lai gan šodien patiesība ir tāda, ka šīs sistēmas ir daudz attīstījušās, mums ir pierādījums Cortana o Siri.

Šodien jaunākā un izsmalcinātākā balss sintēzes programma, ko piedāvā google, programmatūra, kas pazīstama ar nosaukumu Veinets un to ir izveidojuši departamentam piederošie inženieri Deepmind, mākslīgā intelekta uzņēmums, kuru Google iegādājās 2014. gadā. WayNet ir a runas sintēzes programmatūra, kuras pamatā ir sarežģīti mākslīgā intelekta algoritmi kas darbojas kā sarežģīta neironu sistēma.

WaveNet, revolucionārs balss sintezators, kas jūs pārsteigs

Starp jaunumiem, ko piedāvā WayNet, jāatzīmē, ka, lai arī līdz šim galvenā izmantotā metode bija TTS, teksts runā, kur dažādi ierakstīti balss fragmenti tika apvienoti, lai izveidotu vārdus un teikumus, jeb pazīstami kā Parametriskā TTS, metode, kas nosūta tekstu runas kodētājam, kura rezultāti ir pat mazāk dabiski nekā iepriekšējie, mēs tagad atrodam šo WayNet, nevis tikai apvienojot un atskaņojot audio, integrē sarežģītu mākslīgā intelekta sistēmu, kas spēj mācīties un pielāgoties kontekstam.

Šī jaunā sistēma ir spējīga darboties 16.000 XNUMX paraugu sekundē ļaujot pat ģenerēt savas audio sekvences bez cilvēka iejaukšanās. No otras puses, ir vērts pieminēt, ka inženieri, kas ir atbildīgi par tā attīstību, ir ieviesuši sistēmu, kas spēj izmantot statistiku, lai prognozētu, kas tai būs jāsaka vēlāk, un tādējādi nodrošinās, ka sistēma piedāvā rezultātus daudz ātrāk un plūstošāk. Ja jūs interesē WayNet, pastāstiet to, ka tā vietnē varat klausieties dažādus paraugus angļu un ķīniešu valodā.

Más Información: Deepmind


Atstājiet savu komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

*

*

  1. Atbildīgais par datiem: Migels Ángels Gatóns
  2. Datu mērķis: SPAM kontrole, komentāru pārvaldība.
  3. Legitimācija: jūsu piekrišana
  4. Datu paziņošana: Dati netiks paziņoti trešām personām, izņemot juridiskus pienākumus.
  5. Datu glabāšana: datu bāze, ko mitina Occentus Networks (ES)
  6. Tiesības: jebkurā laikā varat ierobežot, atjaunot un dzēst savu informāciju.