WaveNet, suara sintetis baru yang revolusioner yang dibuat oleh DeepMind

WaveNet

Untuk memahami lebih baik apa dan bagaimana cara kerjanya, secara garis besar, sistem suara sintetis Saya ingin merujuk pada contoh jelas yang pasti pernah kita temui pada suatu waktu, khususnya saya berbicara tentang video yang ada di YouTube serta layanan internet lainnya di mana narator berbicara melalui suara yang dihasilkan komputer. Mungkin software membaca yang paling terkenal dan paling banyak digunakan adalah gila Meskipun saat ini kenyataannya adalah bahwa sistem ini telah banyak berkembang, kami memiliki buktinya Cortana o siri.

Hari ini program sintesis pidato terbaru dan canggih disajikan oleh Google, perangkat lunak yang dikenal dengan nama Waynet dan itu dibuat oleh para insinyur di departemen DeepMind, sebuah perusahaan kecerdasan buatan yang diakuisisi oleh Google pada tahun 2014. WayNet adalah perangkat lunak sintesis ucapan berdasarkan algoritma kecerdasan buatan yang kompleks yang berfungsi sebagai sistem saraf yang kompleks.

WaveNet, synthesizer suara revolusioner yang akan mengejutkan Anda

Di antara hal-hal baru yang dihadirkan WayNet, perlu dicatat bahwa meskipun hingga saat ini metode utama yang digunakan adalah TTS, text to speech, di mana berbagai fragmen ucapan yang direkam digabungkan untuk menyusun kata dan kalimat, atau dikenal sebagai TTS parametrik, sebuah metode yang mengirimkan teks ke pengode suara yang hasilnya bahkan kurang natural dari yang sebelumnya, kami sekarang menemukan bahwa WayNet, daripada hanya menggabungkan dan memainkan audio, mengintegrasikan sistem kecerdasan buatan yang kompleks yang mampu belajar dan beradaptasi dengan konteksnya.

Sistem baru ini mampu bekerja 16.000 sampel per detik memungkinkan Anda bahkan membuat urutan audio sendiri tanpa campur tangan manusia. Di sisi lain, perlu disebutkan bahwa para insinyur yang bertanggung jawab atas pengembangannya telah memperkenalkan sistem yang mampu menggunakan statistik untuk memprediksi apa yang akan dikatakan nanti dan dengan demikian memastikan bahwa sistem tersebut menawarkan hasil yang jauh lebih cepat dan lancar. Jika Anda tertarik dengan WayNet, beri tahu Anda bahwa di situs webnya Anda bisa mendengarkan berbagai contoh dalam bahasa Inggris dan Cina Mandarin.

Informasi lebih lanjut: DeepMind


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.