WaveNet, giọng nói tổng hợp mới mang tính cách mạng do DeepMind tạo ra

SóngNet

Để hiểu rõ hơn nó là gì và nó hoạt động như thế nào, nói chung, một hệ thống giọng nói tổng hợp Tôi muốn đề cập đến một ví dụ rõ ràng mà chắc chắn tất cả chúng ta đều đã gặp vào một lúc nào đó, cụ thể là tôi đang nói về những video đó có trên YouTube cũng như các dịch vụ internet khác mà người kể chuyện nói qua máy tính tạo ra giọng nói. Có lẽ phần mềm đọc tốt nhất và được sử dụng rộng rãi nhất là khùng Mặc dù ngày nay sự thật là các hệ thống này đã phát triển rất nhiều, nhưng chúng tôi có bằng chứng về Cortana o Siri.

Hôm nay chương trình tổng hợp lời nói công phu và mới nhất được trình bày bởi Google, một phần mềm được biết đến dưới tên Waynet và điều đó đã được tạo ra bởi các kỹ sư thuộc bộ phận Deepmind, một công ty trí tuệ nhân tạo đã được Google mua lại vào năm 2014. WayNet là một phần mềm tổng hợp giọng nói dựa trên các thuật toán trí tuệ nhân tạo phức tạp có chức năng như một hệ thống thần kinh phức tạp.

WaveNet, một bộ tổng hợp giọng nói mang tính cách mạng sẽ làm bạn ngạc nhiên

Trong số những điểm mới mà WayNet trình bày, cần lưu ý rằng, mặc dù cho đến nay phương pháp chính được sử dụng là TTS, chuyển văn bản thành giọng nói, nơi các đoạn giọng nói đã ghi khác nhau được kết hợp để tạo từ và câu, hay còn được gọi là TTS tham số, một phương pháp gửi văn bản tới bộ mã hóa giọng nói có kết quả thậm chí còn kém tự nhiên hơn so với phương pháp trước đó, chúng tôi hiện thấy rằng WayNet, thay vì chỉ kết hợp và phát âm thanh, tích hợp một hệ thống trí tuệ nhân tạo phức tạp có khả năng học hỏi và thích ứng với bối cảnh.

Hệ thống mới này có khả năng hoạt động 16.000 mẫu mỗi giây cho phép bạn thậm chí tạo chuỗi âm thanh của riêng mình mà không cần sự can thiệp của con người. Mặt khác, điều đáng nói là các kỹ sư chịu trách nhiệm phát triển nó đã giới thiệu một hệ thống có khả năng sử dụng số liệu thống kê để dự đoán những gì nó sẽ phải nói sau đó và do đó làm cho hệ thống đưa ra kết quả nhanh chóng và trôi chảy hơn nhiều. Nếu bạn quan tâm đến WayNet, hãy cho bạn biết rằng trên trang web của nó, bạn có thể nghe nhiều mẫu khác nhau bằng tiếng Anh và tiếng Quan Thoại.

Más información: Deepmind


Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.