เพื่อให้เข้าใจได้ดีขึ้นมากว่าอะไรและทำงานอย่างไรในจังหวะกว้าง ๆ ระบบของ เสียงสังเคราะห์ ฉันต้องการอ้างถึงตัวอย่างที่ชัดเจนซึ่งแน่นอนว่าเราทุกคนเคยเจอมาบ้างแล้วโดยเฉพาะฉันกำลังพูดถึงวิดีโอเหล่านั้นที่นำเสนอบน YouTube รวมถึงบริการอินเทอร์เน็ตอื่น ๆ ที่ผู้บรรยายพูดผ่าน คอมพิวเตอร์สร้างเสียง. บางทีซอฟต์แวร์การอ่านที่รู้จักกันดีและใช้กันอย่างแพร่หลายก็คือ โลเค็นโด แม้ว่าวันนี้ความจริงก็คือระบบเหล่านี้มีการพัฒนาไปมาก แต่เรามีข้อพิสูจน์ใน Cortana o สิริ.
วันนี้โปรแกรมสังเคราะห์เสียงพูดใหม่ล่าสุดและซับซ้อนที่นำเสนอโดย Googleซึ่งเป็นซอฟต์แวร์ที่รู้จักกันในชื่อของ Waynet และได้รับการสร้างขึ้นโดยวิศวกรของแผนก Deepmindซึ่งเป็น บริษัท ปัญญาประดิษฐ์ที่ Google เข้าซื้อกิจการในปี 2014 WayNet คือ ซอฟต์แวร์สังเคราะห์เสียงตามอัลกอริทึมปัญญาประดิษฐ์ที่ซับซ้อน ซึ่งทำหน้าที่เป็นระบบประสาทที่ซับซ้อน
WaveNet เครื่องสังเคราะห์เสียงที่ปฏิวัติวงการที่จะทำให้คุณประหลาดใจ
ในบรรดาสิ่งแปลกใหม่ที่ WayNet นำเสนอควรสังเกตว่าแม้ว่าจนถึงตอนนี้วิธีการหลักที่ใช้คือ TTSข้อความเป็นคำพูดโดยที่ส่วนคำพูดที่บันทึกไว้ต่างกันถูกรวมเข้าด้วยกันเพื่อสร้างคำและประโยคหรือที่เรียกว่า พาราเมตริก TTSซึ่งเป็นวิธีการที่ส่งข้อความไปยังโปรแกรมเข้ารหัสคำพูดซึ่งผลลัพธ์จะดูเป็นธรรมชาติน้อยกว่าวิธีก่อนหน้านี้เราพบว่า WayNet แทนที่จะรวมและเล่นเสียงเท่านั้น รวมระบบปัญญาประดิษฐ์ที่ซับซ้อนซึ่งสามารถเรียนรู้และปรับให้เข้ากับบริบทได้.
ระบบใหม่นี้สามารถทำงานได้ 16.000 ตัวอย่างต่อวินาที ช่วยให้คุณสามารถสร้างลำดับเสียงของคุณเองได้โดยไม่ต้องมีการแทรกแซงจากมนุษย์ ในทางกลับกันเป็นที่น่าสังเกตว่าวิศวกรที่รับผิดชอบในการพัฒนาได้แนะนำระบบที่สามารถใช้สถิติเพื่อคาดการณ์สิ่งที่จะต้องพูดในภายหลังและทำให้มั่นใจได้ว่าระบบจะให้ผลลัพธ์ที่รวดเร็วและลื่นไหลมากขึ้น หากคุณสนใจ WayNet โปรดบอกคุณว่าคุณสามารถทำได้บนเว็บไซต์ ฟังตัวอย่างต่างๆในภาษาอังกฤษและภาษาจีนกลาง.
ข้อมูลเพิ่มเติม: Deepmind