WaveNet, zëri i ri revolucionar sintetik i krijuar nga DeepMind

WaveNet

Për të kuptuar shumë më mirë se çfarë dhe si funksionon, në goditje të gjera, një sistem i zëri sintetik Unë dua t'i referohem një shembulli të qartë që me siguri që të gjithë kemi hasur në një farë kohe, konkretisht po flas për ato video të pranishme në YouTube si dhe shërbime të tjera në internet ku narratori flet përmes një zëri i gjeneruar nga kompjuteri. Ndoshta softueri i leximit më i njohur dhe më i përdorur gjerësisht është i çmendur Edhe pse sot e vërteta është se këto sisteme kanë evoluar shumë, ne e kemi provën Cortana o Siri.

Sot programi më i fundit dhe i sofistikuar i sintezës së të folurit prezantuar nga Google, një program kompjuterik që mban emrin e Waynet dhe që është krijuar nga inxhinierët që i përkasin departamentit Deepmind, një kompani e inteligjencës artificiale që u ble nga Google në 2014. WayNet është një softuer i sintezës së të folurit bazuar në algoritme komplekse të inteligjencës artificiale i cili funksionon si sistem nervor kompleks.

WaveNet, një sintetizues revolucionar i zërit që do t'ju befasojë

Ndër risitë që paraqet WayNet, duhet theksuar se, megjithëse deri më tani metoda kryesore e përdorur ishte TTS, tekst në fjalim, ku fragmente të ndryshme të zërit të regjistruar u kombinuan për të ndërtuar fjalë dhe fjali, ose të njohura si TTS parametrike, një metodë që e dërgon tekstin te një kodues i të folurit rezultatet e të cilit janë edhe më pak natyralë se ai i mëparshmi, tani zbulojmë se WayNet, në vend që thjesht të kombinojë dhe të luajë audio, integron një sistem kompleks të inteligjencës artificiale që është i aftë të mësojë dhe përshtatet me kontekstin.

Ky sistem i ri është i aftë të performojë 16.000 mostra në sekondë duke ju lejuar të gjeneroni edhe sekuencat tuaja audio pa ndërhyrjen njerëzore. Nga ana tjetër, vlen të përmendet se inxhinierët përgjegjës për zhvillimin e tij kanë futur një sistem të aftë të përdorë statistikat për të parashikuar atë që do të thotë më vonë dhe kështu të sigurojë që sistemi ofron rezultate shumë më shpejt dhe rrjedhshëm. Nëse jeni të interesuar për WayNet, ju tregoj se në faqen e saj të internetit mundeni dëgjoni shembuj të ndryshëm në anglisht dhe Mandarin kineze.

Më shumë informacion: Deepmind


Lini komentin tuaj

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar me *

*

*

  1. Përgjegjës për të dhënat: Miguel Ángel Gatón
  2. Qëllimi i të dhënave: Kontrolloni SPAM, menaxhimin e komenteve.
  3. Legjitimimi: Pëlqimi juaj
  4. Komunikimi i të dhënave: Të dhënat nuk do t'u komunikohen palëve të treta përveç me detyrim ligjor.
  5. Ruajtja e të dhënave: Baza e të dhënave e organizuar nga Occentus Networks (BE)
  6. Të drejtat: Në çdo kohë mund të kufizoni, rikuperoni dhe fshini informacionin tuaj.