WaveNet, rewolucyjny nowy syntetyczny głos stworzony przez DeepMind

WaveNet

Aby znacznie lepiej zrozumieć, co i jak działa, ogólnie mówiąc, system głos syntetyczny Chcę odnieść się do wyraźnego przykładu, z którym z pewnością wszyscy kiedyś się spotkaliśmy, a konkretnie mówię o tych filmach obecnych na YouTube, a także o innych usługach internetowych, w których narrator mówi przez głos generowany komputerowo. Być może najbardziej znanym i najczęściej używanym oprogramowaniem do czytania jest zwariowany Chociaż dzisiaj prawda jest taka, że ​​te systemy bardzo ewoluowały, mamy na to dowód Cortana o Siri.

Dziś najnowszy i wyrafinowany program syntezy mowy przedstawiony przez Google, oprogramowanie znane pod nazwą Waynet i to zostało stworzone przez inżynierów należących do działu DeepMind, firma zajmująca się sztuczną inteligencją, która została przejęta przez Google w 2014 roku. WayNet to oprogramowanie do syntezy mowy oparte na złożonych algorytmach sztucznej inteligencji który funkcjonuje jako złożony system neuronowy.

WaveNet, rewolucyjny syntezator głosu, który Cię zaskoczy

Wśród nowości, które prezentuje WayNet, należy zauważyć, że choć do tej pory główną wykorzystywaną metodą był TTS, zamiana tekstu na mowę, w której różne nagrane fragmenty głosu zostały połączone w celu zbudowania słów i zdań lub znane jako Parametric TTS, metoda, która wysyła tekst do kodera mowy, którego wyniki są jeszcze mniej naturalne niż poprzednia, teraz widzimy, że WayNet, zamiast po prostu łączyć i odtwarzać dźwięk, integruje złożony system sztucznej inteligencji, który jest zdolny do uczenia się i dostosowywania do kontekstu.

Ten nowy system jest w stanie działać 16.000 XNUMX próbek na sekundę umożliwiając nawet generowanie własnych sekwencji audio bez interwencji człowieka. Z drugiej strony warto wspomnieć, że inżynierowie odpowiedzialni za jego rozwój wprowadzili system, który potrafi odwołać się do statystyk, aby przewidzieć, co będzie miał do powiedzenia później, dzięki czemu system będzie oferował wyniki znacznie szybciej i płynniej. Jeśli jesteś zainteresowany WayNetem, powiedz, że możesz posłuchaj różnych próbek w języku angielskim i chińskim mandaryńskim.

Więcej informacji: DeepMind


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.