वेपनेट, डीपमाइंड द्वारा बनाई गई क्रांतिकारी नई सिंथेटिक आवाज

WaveNet

व्यापक स्ट्रोक में, क्या है और यह कैसे काम करता है, इसे बेहतर ढंग से समझने के लिए सिंथेटिक आवाज मैं एक स्पष्ट उदाहरण का उल्लेख करना चाहता हूं कि निश्चित रूप से हम सभी कुछ समय में आए हैं, विशेष रूप से मैं उन वीडियो के बारे में बात कर रहा हूं जो YouTube पर मौजूद हैं और साथ ही अन्य इंटरनेट सेवाएं भी हैं जहां कथाकार एक के माध्यम से बोलता है कंप्यूटर उत्पन्न आवाज। शायद सबसे अच्छा ज्ञात और सबसे व्यापक रूप से इस्तेमाल किया जाने वाला रीडिंग सॉफ्टवेयर है पागल हालाँकि आज सच्चाई यह है कि ये प्रणालियाँ बहुत विकसित हो चुकी हैं, हमारे पास इसका प्रमाण है Cortana o सिरी.

आज प्रस्तुत नवीनतम और परिष्कृत भाषण संश्लेषण कार्यक्रम गूगल, एक सॉफ्टवेयर के नाम से जाना जाता है वेनेट और यह विभाग से संबंधित इंजीनियरों द्वारा बनाया गया है Deepmind, एक कृत्रिम बुद्धिमत्ता कंपनी जिसे 2014 में Google द्वारा अधिग्रहित किया गया था। WayNet एक है जटिल कृत्रिम बुद्धि एल्गोरिदम पर आधारित भाषण संश्लेषण सॉफ्टवेयर जो एक जटिल तंत्रिका तंत्र के रूप में कार्य करता है।

वेवनेट, एक क्रांतिकारी आवाज सिंथेसाइज़र जो आपको आश्चर्यचकित करेगा

वेनेट जो उपन्यास प्रस्तुत करता है, उनमें से, यह ध्यान दिया जाना चाहिए कि, हालांकि अब तक मुख्य विधि का उपयोग किया गया था टीटीएस, भाषण के लिए पाठ, जहां अलग-अलग रिकॉर्ड किए गए भाषण टुकड़े शब्दों और वाक्यों के निर्माण के लिए संयुक्त थे, या के रूप में जाना जाता है पैरामीट्रिक टीटीएस, एक विधि जो एक भाषण कोडर को पाठ भेजती है, जिसके परिणाम पिछले एक की तुलना में भी कम स्वाभाविक हैं, हम अब केवल संयोजन और ऑडियो खेलने के बजाय वेनेट को ढूंढते हैं, एक जटिल कृत्रिम खुफिया प्रणाली को एकीकृत करता है जो सीखने और संदर्भ के लिए अनुकूल होने में सक्षम है.

यह नई प्रणाली प्रदर्शन करने में सक्षम है 16.000 नमूने प्रति सेकंड आप भी मानव हस्तक्षेप के बिना अपने खुद के ऑडियो दृश्यों उत्पन्न करने के लिए अनुमति देता है। दूसरी ओर, यह ध्यान देने योग्य है कि इसके विकास के लिए जिम्मेदार इंजीनियरों ने यह कहने के लिए आंकड़ों का सहारा लेने में सक्षम प्रणाली पेश की है कि इसे बाद में क्या कहना होगा और इस प्रकार सिस्टम प्रस्ताव को और अधिक तेज़ी से और तरल रूप से पेश करता है। यदि आप वेनेट में रुचि रखते हैं, तो आपको बता दें कि इसकी वेबसाइट पर आप कर सकते हैं अंग्रेजी और मंदारिन चीनी में विभिन्न नमूनों को सुनें.

अधिक जानकारी: Deepmind


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।