WaveNet, η επαναστατική νέα συνθετική φωνή που δημιουργήθηκε από την DeepMind

WaveNet

Για να κατανοήσουμε πολύ καλύτερα τι είναι και πώς λειτουργεί, σε ευρείες πινελιές, ένα σύστημα συνθετική φωνή Θέλω να αναφερθώ σε ένα σαφές παράδειγμα που σίγουρα όλοι έχουμε συναντήσει κάποια στιγμή, συγκεκριμένα μιλώ για εκείνα τα βίντεο που υπάρχουν στο YouTube καθώς και για άλλες υπηρεσίες διαδικτύου όπου ο αφηγητής μιλά μέσω φωνή που δημιουργείται από υπολογιστή. Ίσως το πιο γνωστό και πιο ευρέως χρησιμοποιούμενο λογισμικό ανάγνωσης είναι Λοκέντο Αν και σήμερα η αλήθεια είναι ότι αυτά τα συστήματα έχουν εξελιχθεί πολύ, έχουμε την απόδειξη Cortana o Siri.

Σήμερα το τελευταίο και εξελιγμένο πρόγραμμα σύνθεσης ομιλίας που παρουσιάστηκε από Google, ένα λογισμικό γνωστό με το όνομα του Waynet και αυτό δημιουργήθηκε από τους μηχανικούς που ανήκουν στο τμήμα Deepmind, μια εταιρεία τεχνητής νοημοσύνης που αποκτήθηκε από την Google το 2014. Το WayNet είναι ένα λογισμικό σύνθεσης ομιλίας βασισμένο σε πολύπλοκους αλγόριθμους τεχνητής νοημοσύνης που λειτουργεί ως ένα πολύπλοκο νευρικό σύστημα.

WaveNet, ένας επαναστατικός συνθέτης φωνής που θα σας εκπλήξει

Μεταξύ των καινοτομιών που παρουσιάζει το WayNet, πρέπει να σημειωθεί ότι, αν και μέχρι τώρα η κύρια μέθοδος που χρησιμοποιήθηκε ήταν η TTS, κείμενο σε ομιλία, όπου διαφορετικά καταγεγραμμένα θραύσματα ομιλίας συνδυάστηκαν για τη δημιουργία λέξεων και προτάσεων, ή γνωστά ως Παραμετρική TTS, μια μέθοδος που στέλνει το κείμενο σε έναν κωδικοποιητή ομιλίας των οποίων τα αποτελέσματα είναι ακόμη λιγότερο φυσικά από τα προηγούμενα, τώρα βρίσκουμε ότι το WayNet, αντί να συνδυάζουμε και να παίζουμε ήχο, ενσωματώνει ένα σύνθετο σύστημα τεχνητής νοημοσύνης που είναι ικανό να μάθει και να προσαρμοστεί στο περιβάλλον.

Αυτό το νέο σύστημα είναι ικανό να λειτουργεί 16.000 δείγματα ανά δευτερόλεπτο επιτρέποντάς σας να δημιουργήσετε ακόμη και τις δικές σας ηχητικές ακολουθίες χωρίς ανθρώπινη παρέμβαση. Από την άλλη πλευρά, αξίζει να σημειωθεί ότι οι μηχανικοί που είναι υπεύθυνοι για την ανάπτυξή του έχουν εισαγάγει ένα σύστημα ικανό να καταφύγει σε στατιστικές για να προβλέψει τι θα πει αργότερα και έτσι να διασφαλίσει ότι το σύστημα προσφέρει αποτελέσματα πολύ πιο γρήγορα και ρευστά. Εάν ενδιαφέρεστε για το WayNet, πείτε ότι στον ιστότοπό του μπορείτε ακούστε διάφορα δείγματα στα Αγγλικά και στα Κινεζικά Μανδαρινικά.

Περισσότερες πληροφορίες: Deepmind


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.