माउंटेन व्यू, कैलिफोर्निया: आर्टिफिशियल इंटेलिजेंस (एआई) परत जो Google को उम्मीद है कि एक सार्वभौमिक एआई सहायक के लिए उनकी दृष्टि के लिए महत्वपूर्ण खोज, खरीदारी, कार्यक्षेत्र, फिल्म निर्माण और वीडियो संचार प्लेटफार्मों में तेजी से गहनता मिलेगी। यह वार्षिक Google I/O सम्मेलन में घोषित किया गया था, यहां तक कि प्रतियोगिता के रूप में, Openai, एन्थ्रोपिक और Microsoft सहित, हाल के महीनों में, अपने AI प्रस्ताव के साथ महत्वपूर्ण आंदोलन किया है।
“अधिक बुद्धिमत्ता उपलब्ध है, हर किसी के लिए, हर जगह। और दुनिया जवाब दे रही है, एआई को पहले से कहीं ज्यादा तेजी से अपना रही है … यह सब प्रगति का मतलब है कि हम एआई प्लेटफॉर्म शिफ्ट के एक नए चरण में हैं। जहां दशकों के शोध अब दुनिया भर में लोगों, व्यवसायों और समुदायों के लिए एक वास्तविकता बन रहे हैं,” सुंदार पिचाई, मुख्य कार्यकारी अधिकारी (सीईओ)।
पिचाई ने कुछ साल पहले से 3 डी वीडियो स्ट्रीमिंग तकनीक प्रोजेक्ट स्टारलाइन के एक उदाहरण का हवाला दिया, नए और सटीक Google बीम एआई वीडियो संचार प्लेटफॉर्म के लिए अंतर्निहित तकनीक के रूप में जो एचपी के कंप्यूटिंग उपकरणों पर इस साल के अंत में रोल करता है। इसके दावा किए गए पार्टी के टुकड़ों में से एक – हेड मूवमेंट ट्रैकिंग, मिलीमीटर तक।
एआई एजेंट एक सतत विषय साबित होते हैं, कुछ ओपनईएआई, आईबीएम, एन्थ्रोपिक और माइक्रोसॉफ्ट ने हाल ही में भी एक मामला बनाया है।
“मिथुन के लिए हमारे हालिया अपडेट एक सार्वभौमिक एआई सहायक के लिए हमारी दृष्टि को अनलॉक करने की दिशा में महत्वपूर्ण कदम हैं, एक जो आपके रोजमर्रा के जीवन में सहायक है, यह बुद्धिमान है और आप जिस संदर्भ में हैं, उसे समझता है, और यह किसी भी डिवाइस में आपकी ओर से कार्रवाई कर सकता है।
Google के लिए, AI एजेंट एक बहु-आयामी दृष्टिकोण का परिणाम होगा, एक जो कि मिथुन 2.5 मॉडल imbibe बढ़ाया तर्क को देखता है, मिथुन ऐप क्रिएटिव कोडिंग के लिए कैनवास के साथ वीडियो समझ को जोड़ता है या पॉडकास्ट बनाने के साथ-साथ नए वीडियो जनरेशन मॉडल वीओ 3 और इमेज जनरेटर इमेजेन 4 की उपलब्धता है, जो अंत में एक सार्वभौमिक AI के लिए नेतृत्व करता है।
यह प्रोजेक्ट एस्ट्रा पर बनाता है, एआई स्थितिजन्य संदर्भ देने के लिए, जैसे वीडियो समझ, स्क्रीन साझाकरण और मेमोरी।
Google ने कहा कि मिथुन, और इसमें एंड्रॉइड और आईओएस के लिए इसके ऐप भी शामिल हैं, ने 400 मिलियन मासिक सक्रिय उपयोगकर्ताओं को पार कर लिया है और दुनिया भर में 7 मिलियन डेवलपर्स इन मॉडलों के साथ ऐप्स का निर्माण कर रहे हैं। यह प्रोजेक्ट मेरिनर की एक परिणति होगी, जिसे हसबिस ने समझाया, “ब्राउज़रों से शुरू होने वाले मानव-एजेंट इंटरैक्शन के भविष्य की पड़ताल करता है”।
इसमें अब एजेंटों की एक प्रणाली शामिल है जो एक समय में दस अलग -अलग कार्यों को पूरा कर सकती है। हसबिस ने कहा कि इन कार्यों में जानकारी देखना, बुकिंग करना, चीजें खरीदना, और किसी विषय पर शोध करना शामिल हो सकता है।
साथ ही, कैमरा और स्क्रीन शेयरिंग के साथ मिथुन लाइव, अब एंड्रॉइड डिवाइसों के साथ -साथ ऐप्पल आईफोन पर मुफ्त टियर पर सभी उपयोगकर्ताओं के लिए उपलब्ध है। “, मिथुन लाइव आपके दैनिक जीवन में अधिक गहराई से एकीकृत होगा। दोस्तों के साथ एक रात की योजना बना रहे हैं? मिथुन लाइव में विवरण पर चर्चा करें, और यह तुरंत आपके Google कैलेंडर में एक घटना बनाता है,” हसैबिस बताते हैं, Google मैप्स, कार्यों के लिए एकीकरण योजनाओं का विस्तार करते हुए और भी रखें।
Google ने पहले अनुमान लगाया था कि उसके प्रतिद्वंद्वी Openai के CHATGPT में मार्च में लगभग 600 मिलियन मासिक उपयोगकर्ता थे। मेटा के मार्क जुकरबर्ग ने सितंबर में दावा किया कि मेटा एआई तब 500 मिलियन मासिक उपयोगकर्ताओं के पास था।
मिथुन 2.5 प्रो के लिए आने वाले सुधार, डीप थिंक मोड के साथ नई तर्क क्षमताएं जोड़ें। जटिल गणित और कोडिंग कार्यों पर इसका विशिष्ट ध्यान, मिथुन के मार्च के लिए ‘एजेंटिक एआई’ विजन की ओर प्रासंगिक होगा। यह परिष्कृत तर्क पर ध्यान एआई की ओर एक व्यापक उद्योग प्रवृत्ति के साथ संरेखित करता है जो न केवल सामग्री उत्पन्न कर सकता है, बल्कि जटिल समस्या-समाधान भी करता है-ओपनईआई के ओ 1, एन्थ्रोपिक के क्लाउड और एक्सई के ग्रोक 3 उदाहरण हैं।
“लर्नलम को शामिल करने के बाद से, शैक्षिक विशेषज्ञों के साथ निर्मित मॉडल का हमारा परिवार, 2.5 प्रो अब सीखने के लिए प्रमुख मॉडल भी है। सिर-से-सिर की तुलना में इसकी शिक्षाशास्त्र और प्रभावशीलता का मूल्यांकन करते हुए, शिक्षकों और विशेषज्ञों ने Google Kavukcuoglu, CHTO DEEPMIND के अन्य मॉडलों पर अन्य मॉडलों पर Gemini 2.5 Pro को प्राथमिकता दी।
लाइटर मिथुन 2.5 फ्लैश में बेहतर तर्क, मल्टीमॉडलिटी, कोड और लंबे संदर्भ को प्राप्त होता है। अभी के लिए, अद्यतन 2.5 फ्लैश डेवलपर्स के लिए Google एआई स्टूडियो में ‘प्रयोगात्मक’ के रूप में उपलब्ध है, उद्यमों के लिए वर्टेक्स एआई में, और सभी के लिए मिथुन ऐप में – इसकी अंतिम रिलीज जून की शुरुआत में है।
Google के यूनिवर्सल एआई सहायक विकास में एक महत्वपूर्ण भूमिका निभाना, कंपनी का खोज मंच है। एक एआई मोड को खोजने के लिए जोड़ा जा रहा है, जो अमेरिका में उपयोगकर्ताओं के साथ शुरू हो रहा है, उन्नत तर्क और मल्टीमॉडलिटी के लिए मिथुन की फ्रंटियर क्षमताओं का उपयोग करता है।
Google खोज के प्रमुख, लिज़ रीड, जो उपाध्यक्ष हैं, ने कहा कि AI मोड क्वेरी फैन-आउट तकनीक का उपयोग करेगा, जो किसी उपयोगकर्ता द्वारा पूछे गए किसी भी प्रश्न को तोड़ने के लिए, आगे के सबटोपिक्स में होगा। रीड ने कहा, “यह Google पर एक पारंपरिक खोज की तुलना में वेब में गहराई से गोता लगाने में सक्षम बनाता है, जिससे आपको और भी अधिक पता लगाने में मदद मिलती है कि वेब को आपके प्रश्न से मेल खाने वाली अविश्वसनीय, हाइपर-प्रासंगिक सामग्री को क्या पेश करना है।” Google लेंस के साथ -साथ विज़ुअल सर्च पर्ससिट्स में शामिल होना सर्च लाइव है, जो एक उपयोगकर्ता को खोज शुरू करने और उसे संवादात्मक रूप से ले जाने के लिए फोन के कैमरे को उनके आसपास की किसी भी चीज़ पर इंगित करने की अनुमति देगा।