Google એ લોન્ચ કર્યું Gemini 3.5 Live Translate: હવે લાઈવ વાતચીત સરળ બનશે
ટેક જાયન્ટ ગૂગલે (Google) બુધવારે તેનું સૌથી નવું અને એડવાન્સ સ્પીચ-ટુ-સ્પીચ ટ્રાન્સલેશન મોડલ Gemini 3.5 Live Translate સત્તાવાર રીતે રોલ આઉટ કરી દીધું છે. કંપનીના જણાવ્યા અનુસાર, આ નવું AI મોડલ જુદી-જુદી ભાષાઓ બોલતા લોકો વચ્ચેની વાતચીતને વધુ કુદરતી અને સરળ બનાવવા માટે ડિઝાઇન કરવામાં આવ્યું છે. આ મોડલની ખાસિયત એ છે કે તે 70 થી વધુ ભાષાઓને આપોઆપ ઓળખી શકે છે અને સેકન્ડોમાં તેનો અનુવાદ (Translation) કરી શકે છે. આ નવું ફીચર ગૂગલ ટ્રાન્સલેટ, ગૂગલ મીટ, ગૂગલ AI સ્ટુડિયો અને ડેવલપર્સ માટે જેમિની લાઈવ API પર ઉપલબ્ધ કરાવાઈ રહ્યું છે.
રિયલ-ટાઇમમાં ઓડિયો પ્રોસેસ કરશે આ નવું મોડલ
ગૂગલે એક બ્લોગ પોસ્ટમાં જણાવ્યું છે કે, Gemini 3.5 Live Translate લાઈવ વાતચીત દરમિયાન કોઈપણ અટકાવ કે વિરામ વગર કામ કરે છે. તે ઓડિયો સ્ટ્રીમ થવાની સાથે જ તેને પ્રોસેસ કરે છે, જેના કારણે મૂળ સ્પીકરના બોલ્યાના માત્ર થોડી જ સેકન્ડોમાં અનુવાદિત ઓડિયો સંભળાય છે. પરંપરાગત ટ્રાન્સલેશન સિસ્ટમની જેમ આમાં સામેવાળા વ્યક્તિના બોલી રહ્યા પછી લાંબો સમય રાહ જોવી પડતી નથી.
સૌથી મહત્વની વાત એ છે કે આ મોડલ ટ્રાન્સલેશન કરતી વખતે સ્પીકરનો અવાજ, બોલવાની ઝડપ અને તેના હાવભાવ (Intonation) ને પણ જાળવી રાખે છે. મલ્ટિલિંગ્વલ મીટિંગ્સ, લાઈવ બ્રોડકાસ્ટ, ઓનલાઈન ક્લાસ અને કસ્ટમર સપોર્ટ માટે આ ટેકનોલોજી ખૂબ જ ઉપયોગી સાબિત થશે.
ગૂગલ મીટ અને ટ્રાન્સલેટ એપમાં મળશે મોટો ફાયદો
આ નવી ટેકનોલોજીના કારણે ગૂગલ મીટ (Google Meet) માં પણ મોટો અપગ્રેડ જોવા મળશે. અત્યાર સુધી ગૂગલ મીટમાં માત્ર 5 ભાષાઓ સપોર્ટ કરતી હતી, જે હવે વધીને 70 થી વધુ થઈ જશે. આ સિવાય એન્ડ્રોઇડ (Android) અને આઇઓએસ (iOS) બંને યુઝર્સને ગૂગલ ટ્રાન્સલેટ એપમાં આ ફીચર મળશે, જેનાથી યુઝર્સ કનેક્ટેડ હેડફોન દ્વારા લાઈવ ટ્રાન્સલેશન સાંભળી શકશે. એન્ડ્રોઇડ યુઝર્સ માટે ખાસ Listening Mode પણ રોલ આઉટ કરવામાં આવી રહ્યો છે, જેથી ટ્રાન્સલેટ થયેલો ઓડિયો સીધો સ્માર્ટફોનના ઈયરપીસમાં સાંભળી શકાય.
ઘોંઘાટવાળા વાતાવરણમાં પણ કરશે સચોટ કામ
સામાન્ય રીતે ભીડભાડ કે અવાજવાળી જગ્યાએ AI મોડલ બરાબર કામ નથી કરતા, પરંતુ ગૂગલનો દાવો છે કે Gemini 3.5 Live Translate ઘોંઘાટવાળા અને અનિશ્ચિત વાતાવરણમાં પણ એટલું જ અસરકારક રહેશે. આ સિવાય યુઝર્સે કઈ ભાષામાં અનુવાદ કરવો છે તેનું મેન્યુઅલ સેટિંગ પણ વારંવાર બદલવું નહીં પડે, મોડલ પોતે જ ભાષા સમજીને સ્વિચ થઈ જશે.
AI દ્વારા જનરેટ કરાયેલા કન્ટેન્ટની સુરક્ષાને ધ્યાનમાં રાખીને ગૂગલે સ્પષ્ટ કર્યું છે કે, આ મોડલ દ્વારા જનરેટ થતા તમામ ઓડિયોમાં SynthID વોટરમાર્ક ટેકનોલોજીનો ઉપયોગ કરવામાં આવ્યો છે, જેથી સરળતાથી ઓળખી શકાય કે આ ઓડિયો AI દ્વારા તૈયાર કરવામાં આવ્યો છે.





