WaveNet, DeepMindin luoma vallankumouksellinen uusi synteettinen ääni

WaveNet

Ymmärtää paljon paremmin, mikä ja miten se toimii, yleisesti ottaen järjestelmä synteettinen ääni Haluan viitata selkeään esimerkkiin, jonka varmasti olemme kaikki kohdanneet jonkin aikaa, erityisesti puhun niistä YouTubessa olevista videoista ja muista Internet-palveluista, joissa kertoja puhuu tietokoneella luotu ääni. Ehkä tunnetuin ja eniten käytetty lukuohjelmisto on Loquendo Vaikka nykyään totuus on, että nämä järjestelmät ovat kehittyneet paljon, meillä on todiste siitä Cortana o Siri.

Tänään uusin ja hienostunut puheen synteesiohjelma Google, ohjelmisto, joka tunnetaan nimellä Waynet ja sen ovat luoneet osastolle kuuluvat insinöörit Deepmind, tekoälyyritys, jonka Google osti vuonna 2014. WayNet on puhesynteesiohjelmisto, joka perustuu monimutkaisiin tekoälyn algoritmeihin joka toimii monimutkaisena hermojärjestelmänä.

WaveNet, vallankumouksellinen äänisyntetisaattori, joka yllättää sinut

WayNetin esittelemien uutuuksien joukosta on huomattava, että vaikka tähän asti tärkein käytetty menetelmä oli TTS, teksti puheeksi, jossa eri äänitetyt äänifragmentit yhdistettiin sanojen ja lauseiden muodostamiseksi tai jotka tunnetaan nimellä Parametrinen TTS, menetelmä, joka lähettää tekstin puhekooderille, jonka tulokset ovat vielä vähemmän luonnollisia kuin edellinen, havaitsemme nyt, että WayNet sen sijaan, että vain yhdistää ja toistaa ääntä, integroi monimutkaisen tekoälyjärjestelmän, joka kykenee oppimaan ja mukautumaan asiayhteyteen.

Tämä uusi järjestelmä pystyy toimimaan 16.000 näytettä sekunnissa jonka avulla voit jopa luoda omia audiosekvenssejäsi ilman ihmisen väliintuloa. Toisaalta on syytä mainita, että sen kehittämisestä vastaavat insinöörit ovat ottaneet käyttöön järjestelmän, joka kykenee turvautumaan tilastoihin ennustamaan, mitä sillä on myöhemmin sanottavaa, ja siten varmistamaan, että järjestelmä tarjoaa tuloksia paljon nopeammin ja sujuvammin. Jos olet kiinnostunut WayNetistä, kerro siitä sen verkkosivustolla kuunnella erilaisia ​​näytteitä englanniksi ja kiinaksi mandariiniksi.

Más información: Deepmind


Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastuussa tiedoista: Miguel Ángel Gatón
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.