माउंटेन व्यू, कैलिफोर्निया: Google का कहना है कि एक पर्याप्त कृत्रिम बुद्धिमत्ता (AI) परत जल्दी से खोज, खरीदारी, कार्यक्षेत्र, फिल्म निर्माण और वीडियो संचार प्लेटफार्मों के दौरान प्रासंगिकता और गहराई पाएगी। यह एक सार्वभौमिक एआई सहायक के लिए उनकी दृष्टि के लिए महत्वपूर्ण है, जो वार्षिक Google I/O सम्मेलन में विस्तृत है। यह, ओपनईएआई, एन्थ्रोपिक और माइक्रोसॉफ्ट सहित इसकी प्रतियोगिता के रूप में भी अपने एआई टूल के साथ महत्वपूर्ण प्रगति की है।
“अधिक बुद्धिमत्ता उपलब्ध है, सभी के लिए, हर जगह। और दुनिया जवाब दे रही है, एआई को पहले से कहीं ज्यादा तेजी से अपना रही है … यह सब प्रगति का मतलब है कि हम एआई प्लेटफॉर्म शिफ्ट के एक नए चरण में हैं। जहां दशकों के शोध अब दुनिया भर में लोगों, व्यवसायों और समुदायों के लिए एक वास्तविकता बन रहे हैं,” सुंदार पिचाई, सीईओ, सीईओ, गूगल और वर्णमाला ने कहा।
पिचाई ने कुछ साल पहले से 3 डी वीडियो स्ट्रीमिंग तकनीक प्रोजेक्ट स्टारलाइन के एक उदाहरण का हवाला दिया, नए Google बीम एआई वीडियो कम्युनिकेशंस प्लेटफॉर्म के लिए एक अंतर्निहित तकनीक के रूप में, जो एचपी के कंप्यूटिंग उपकरणों पर इस साल के अंत में रोल करता है। इसके दावा किए गए पार्टी के टुकड़ों में से एक – हेड मूवमेंट ट्रैकिंग, मिलीमीटर तक।
एआई एजेंट एक सतत विषय साबित होते हैं, कुछ Openai, IBM, एंथ्रोपिक और Microsoft हाल ही में, के लिए भी एक मामला बनाया है।
“मिथुन के लिए हमारे हालिया अपडेट एक सार्वभौमिक एआई सहायक के लिए हमारी दृष्टि को अनलॉक करने की दिशा में महत्वपूर्ण कदम हैं, एक जो आपके रोजमर्रा के जीवन में सहायक है, यह बुद्धिमान है और आप जिस संदर्भ में हैं, उसे समझता है, और यह किसी भी डिवाइस में आपकी ओर से कार्रवाई कर सकता है।
Google के लिए, AI एजेंट एक बहु-आयामी दृष्टिकोण का परिणाम होगा, जो कि GEMINI 2.5 मॉडल imbibe बढ़ी हुई तर्क को देखता है, GEMINI ऐप क्रिएटिव कोडिंग या पॉडकास्ट बनाने के लिए कैनवास जोड़ता है, साथ ही साथ APP के भीतर नए वीडियो जनरेशन मॉडल VEO 3 और छवि जनरेटर इमेजेन 4, भी।
दो Google परियोजनाएं मिथुन के नियोजित परिवर्तन में महत्वपूर्ण योगदान देती हैं।
यह प्रोजेक्ट एस्ट्रा पर बनाता है, एआई स्थितिजन्य संदर्भ देने के लिए, जैसे वीडियो समझ, स्क्रीन साझाकरण और मेमोरी। Google ने कहा कि मिथुन, और इसमें एंड्रॉइड और आईओएस के लिए इसके ऐप भी शामिल हैं, ने 400 मिलियन मासिक सक्रिय उपयोगकर्ताओं को पार कर लिया है और दुनिया भर में 7 मिलियन डेवलपर्स इन मॉडलों के साथ ऐप्स का निर्माण कर रहे हैं।
यह प्रोजेक्ट मेरिनर की एक परिणति भी होगी, जिसे, जैसा कि हसबिस ने समझाया, “ब्राउज़रों से शुरू होने वाले मानव-एजेंट इंटरैक्शन के भविष्य की पड़ताल करता है”। इसमें अब एजेंटों की एक प्रणाली शामिल है जो एक समय में दस अलग -अलग कार्यों को पूरा कर सकती है। हसबिस ने कहा कि इन कार्यों में जानकारी देखना, बुकिंग करना, चीजें खरीदना, और किसी विषय पर शोध करना शामिल हो सकता है।
इसके अलावा, कैमरा और स्क्रीन शेयरिंग के साथ मिथुन लाइव, अब एंड्रॉइड डिवाइसों के साथ -साथ ऐप्पल आईफोन पर मुफ्त टियर पर सभी उपयोगकर्ताओं के लिए उपलब्ध है। हसैबी ने कहा, “आने वाले हफ्तों में, मिथुन लाइव आपके दैनिक जीवन में अधिक गहराई से एकीकृत होगा। दोस्तों के साथ एक रात की योजना बना रहा है? मिथुन लाइव में विवरण पर चर्चा करें, और यह तुरंत आपके Google कैलेंडर में एक घटना बनाता है,” हसबिस ने Google मैप्स, कार्यों के लिए एकीकरण योजनाओं का विस्तार किया और भी रखा।
Google ने अनुमान लगाया कि उसके प्रतिद्वंद्वी Openai के CHATGPT में मार्च में लगभग 600 मिलियन मासिक उपयोगकर्ता थे। मेटा के मार्क जुकरबर्ग ने सितंबर में दावा किया कि मेटा एआई तब 500 मिलियन मासिक उपयोगकर्ताओं के पास था।
मिथुन 2.5 प्रो के लिए आने वाले सुधार, डीप थिंक मोड के साथ नई तर्क क्षमताएं जोड़ें। जटिल गणित और कोडिंग कार्यों पर इसका विशिष्ट ध्यान, मिथुन के मार्च के लिए ‘एजेंटिक एआई’ विजन की ओर प्रासंगिक होगा। यह परिष्कृत तर्क पर ध्यान एआई की ओर एक व्यापक उद्योग प्रवृत्ति के साथ संरेखित करता है जो न केवल सामग्री उत्पन्न कर सकता है, बल्कि जटिल समस्या-समाधान भी करता है-ओपनईआई के ओ 1, एन्थ्रोपिक के क्लाउड और एक्सई के ग्रोक 3 उदाहरण हैं।
“लर्नलम को शामिल करने के बाद से, शैक्षिक विशेषज्ञों के साथ निर्मित मॉडलों का हमारा परिवार, 2.5 प्रो अब सीखने के लिए प्रमुख मॉडल भी है। सिर-से-सिर की तुलना में इसकी शिक्षाशास्त्र और प्रभावशीलता का मूल्यांकन करते हुए, शिक्षकों और विशेषज्ञों ने मिथुन 2.5 को अन्य मॉडलों पर अन्य मॉडलों को पसंद किया, जो कि गूगल के गूगल, डीपमाइंड के एक विविध रेंज में अन्य मॉडलों पर है।”
लाइटर मिथुन 2.5 फ्लैश में बेहतर तर्क, मल्टीमॉडलिटी, कोड और लंबे संदर्भ को प्राप्त होता है। अभी के लिए, अद्यतन 2.5 फ्लैश डेवलपर्स के लिए Google एआई स्टूडियो में ‘प्रयोगात्मक’ के रूप में उपलब्ध है, उद्यमों के लिए वर्टेक्स एआई में, और सभी के लिए मिथुन ऐप में – इसकी अंतिम रिलीज जून की शुरुआत में है।
Google के यूनिवर्सल एआई सहायक विकास में एक महत्वपूर्ण भूमिका निभाना, कंपनी का खोज मंच है। अमेरिका में उपयोगकर्ताओं के साथ शुरू होने वाली खोज में एक एआई मोड, उन्नत तर्क और बहुपक्षीयता के लिए मिथुन की सीमांत क्षमताओं का उपयोग करता है। Google खोज के प्रमुख, लिज़ रीड, जो VP हैं, ने बताया कि AI मोड क्वेरी फैन-आउट तकनीक का उपयोग करेगा, जो उपयोगकर्ता द्वारा पूछे गए किसी भी प्रश्न को तोड़ने के लिए, आगे के उप-विज्ञान में है। “यह खोज को Google पर पारंपरिक खोज की तुलना में वेब में गहराई से गोता लगाने में सक्षम बनाता है,” रीड ने कहा।