Da bi veliko bolje razumeli, kaj in kako deluje, na splošno sistem sintetični glas Želim se sklicevati na jasen primer, ki smo ga zagotovo že kdaj naleteli, natančneje, govorim o tistih videoposnetkih, ki so prisotni v YouTubu, in drugih internetnih storitvah, kjer pripovedovalec govori računalniško ustvarjen glas. Morda najbolj znana in najpogosteje uporabljena programska oprema za branje je noro Čeprav je danes resnica, da so se ti sistemi zelo razvili, imamo dokaz Cortana o Siri.
Danes je predstavil najnovejši in dovršeni program za sintezo govora google, programska oprema, znana pod imenom Waynet in to so ustvarili inženirji, ki pripadajo oddelku Deepmind, podjetje za umetno inteligenco, ki ga je Google kupil leta 2014. WayNet je programska oprema za sintezo govora, ki temelji na kompleksnih algoritmih umetne inteligence ki deluje kot kompleksen nevronski sistem.
WaveNet, revolucionarni sintetizator glasu, ki vas bo presenetil
Med novostmi, ki jih WayNet predstavlja, je treba omeniti, da je bila do zdaj glavna uporabljena metoda TTS, besedilo v govor, kjer so bili za snemanje besed in stavkov kombinirani različni posneti drobci glasu ali znani kot Parametrični TTS, metoda, ki besedilo pošlje kodirniku govora, katerega rezultati so še manj naravni od prejšnjega, zdaj ugotavljamo, da WayNet, namesto da samo kombinira in predvaja zvok, vključuje kompleksen sistem umetne inteligence, ki se je sposoben učiti in prilagajati kontekstu.
Ta novi sistem je zmogljiv 16.000 vzorcev na sekundo kar vam omogoča celo ustvarjanje lastnih zvočnih zaporedij brez človekovega posredovanja. Po drugi strani pa velja omeniti, da so inženirji, odgovorni za njegov razvoj, uvedli sistem, ki se lahko zateče k statistiki, da napove, kaj bo moral kasneje povedati, in s tem zagotovi, da sistem ponuja rezultate veliko hitreje in bolj tekoče. Če vas WayNet zanima, povejte, da na njegovi spletni strani lahko poslušajte različne vzorce v angleščini in mandarinščini.
Más información: Deepmind