બ્રોડ સ્ટ્રોકમાં, કઈ સિસ્ટમ અને તે કેવી રીતે કાર્ય કરે છે તે વધુ સારી રીતે સમજવા માટે કૃત્રિમ અવાજ હું એક સ્પષ્ટ ઉદાહરણનો સંદર્ભ લેવા માંગુ છું કે ચોક્કસ આપણે બધાં કોઈક સમયે આવી ગયાં છે, ખાસ કરીને હું યુટ્યુબ પર હાજર તે વિડિઓઝ તેમજ અન્ય ઇન્ટરનેટ સેવાઓ વિશે વાત કરી રહ્યો છું જ્યાં વાર્તાકાર બોલાવે છે કમ્પ્યુટર પેદા અવાજ. કદાચ સૌથી વધુ જાણીતું અને મોટા પ્રમાણમાં વપરાયેલ વાંચન સ softwareફ્ટવેર છે લોક્વેન્ડો જોકે આજે સત્ય એ છે કે આ સિસ્ટમો ઘણું વિકસિત થઈ છે, આપણી પાસે પુરાવો છે કોર્ટાના o સિરી.
આજે પ્રસ્તુત છેલ્લો અને વ્યવહારુ ભાષણ સંશ્લેષણ કાર્યક્રમ Google, ના નામથી જાણીતું એક સ softwareફ્ટવેર વેનેટ અને તે વિભાગ સાથે જોડાયેલા ઇજનેરો દ્વારા બનાવવામાં આવ્યું છે Deepmind, એક કૃત્રિમ ગુપ્તચર કંપની, જે ગૂગલે 2014 માં હસ્તગત કરી હતી. વેનેટ એ જટિલ કૃત્રિમ બુદ્ધિ અલ્ગોરિધમ્સ પર આધારિત સ્પીચ સંશ્લેષણ સ softwareફ્ટવેર જે એક જટિલ ન્યુરલ સિસ્ટમ તરીકે કાર્ય કરે છે.
વેવનેટ, ક્રાંતિકારી અવાજ સિંથેસાઇઝર કે જે તમને આશ્ચર્યચકિત કરશે
વેએનેટ રજૂ કરેલી નવીનતાઓમાં, એ નોંધવું જોઇએ કે, જોકે હવે ત્યાં સુધી મુખ્ય પદ્ધતિનો ઉપયોગ કરવામાં આવ્યો હતો ટીટીએસ, ટેક્સ્ટ ટુ સ્પીચ, જ્યાં શબ્દો અને વાક્યો બનાવવા માટે વિવિધ રેકોર્ડ કરેલ ભાષણના ટુકડાઓ જોડવામાં આવ્યા હતા, અથવા તરીકે ઓળખાય છે પેરામેટ્રિક ટીટીએસ, એક એવી રીત જે સ્પીચ કોડરને ટેક્સ્ટ મોકલે છે, જેનાં પરિણામો અગાઉના એક કરતા પણ ઓછા કુદરતી છે, હવે આપણે ફક્ત ઓડિયોને સંયોજિત કરવા અને વગાડવાને બદલે વેએનેટ શોધીએ છીએ, એક જટિલ કૃત્રિમ ગુપ્તચર પ્રણાલીને એકીકૃત કરે છે જે સંદર્ભમાં શીખવા અને અનુકૂલન માટે સક્ષમ છે.
આ નવી સિસ્ટમ પ્રદર્શન કરવામાં સક્ષમ છે 16.000 સેકન્ડ પ્રતિ સેકન્ડ તમને માનવ હસ્તક્ષેપ વિના તમારા પોતાના audioડિઓ સિક્વન્સ પણ બનાવવાની મંજૂરી આપે છે. બીજી બાજુ, તે ઉલ્લેખનીય છે કે તેના વિકાસ માટે જવાબદાર એન્જિનિયરોએ પછીથી શું કહેવું પડશે તેની આગાહી કરવા માટે આંકડાનો આશરો લેવાની સક્ષમ સિસ્ટમની રજૂઆત કરી છે અને આમ ખાતરી આપે છે કે સિસ્ટમ વધુ ઝડપથી અને પ્રવાહી રીતે પરિણામો આપે છે. જો તમને વેનેટમાં રસ છે, તો તમને કહો કે તેની વેબસાઇટ પર તમે કરી શકો છો અંગ્રેજી અને મેન્ડરિન ચાઇનીઝનાં વિવિધ નમૂનાઓ સાંભળો.
વધુ માહિતી: Deepmind