Sunday, June 1, 2025
spot_img
HomeBusinessएआई संचालित सहायकों की सुंदरता प्राकृतिक भाषा है: Google की एंजेला सन

एआई संचालित सहायकों की सुंदरता प्राकृतिक भाषा है: Google की एंजेला सन


माउंटेन व्यू, कैलिफोर्निया: Google मिथुन आर्टिफिशियल इंटेलिजेंस (AI) मॉडल ने एक महत्वपूर्ण कदम आगे बढ़ाया है। इस वर्ष के Google I/O 2025 कीनोट में, सुंदर पिचाई जो Google और वर्णमाला के लिए सीईओ हैं, और Google DeepMind में सीईओ हैं, डेमिस हसाबिस ने चैटबॉट के लिए कंपनी की दृष्टि का खुलासा किया, जो एक बहुमुखी सार्वभौमिक एआई सहायक में विकसित होना चाहिए। या जैसा कि कुछ अन्य कंपनियां इस प्रवृत्ति, एआई एजेंटों या एजेंटिक एआई को कहते हैं। Google की मौजूदा परियोजनाओं में से दो ने मिथुन के नियोजित परिवर्तन-प्रोजेक्ट एस्ट्रा में महत्वपूर्ण योगदान दिया, एआई स्थितिजन्य संदर्भ देने के लिए, जैसे कि वीडियो समझ, स्क्रीन साझाकरण और मेमोरी, साथ ही साथ प्रोजेक्ट मेरिनर, जो मानव-एजेंट इंटरैक्शन के भविष्य की पड़ताल करता है, ब्राउज़र्स से शुरू होता है।

कीनोट के किनारे पर, एचटी ने एंजेला सन, उत्पाद के निदेशक, मिथुन ऐप्स के साथ बात की। (आधिकारिक तस्वीर)

कीनोट के मौके पर, एचटी ने एंजेला सन, उत्पाद के निदेशक, मिथुन ऐप्स के साथ बात की, ताकि समय के साथ एआई सहायक दृष्टि को ठीक से कैसे ठीक किया जा सके, प्रमुख तकनीकी चुनौतियों और नैतिक विचारों के साथ-साथ उपयोगकर्ता अनुभव जो एक महत्वपूर्ण परिवर्तन से गुजर रहा है। सन, आयरनवुड सिलिकॉन, सातवीं पीढ़ी के टेंसर प्रोसेसिंग यूनिट, या टीपीयू को श्रेय देता है, जो बड़े पैमाने पर एआई अनुमान के लिए अनुकूलित है। वह कहती हैं, “यह इन सभी एआई प्रगति को बढ़ावा देता है। हर दिन एक हार्डवेयर और सिलिकॉन के दृष्टिकोण से अनुकूलन और दक्षता पर हमारा ध्यान केंद्रित करता है। यह वास्तव में एआई की रीढ़ है,” वह कहती हैं। संपादित अंश।

प्र। जिस दृष्टि से हमने एक सार्वभौमिक एआई सहायक के लिए देखा है, वह आश्चर्यजनक से कम नहीं है। क्या आप हमें यह समझ सकते हैं कि यह दृष्टि समय के साथ कैसे ठीक थी। और उस संबंध में, क्या दो परियोजनाएं (एस्ट्रा और मेरिनर) इस समय के लिए इस समय के लिए प्राइम किए जा रहे थे?

एंजेला सन: हमारी दृष्टि वास्तव में एआई सहायक की यह सही अभिव्यक्ति है। हर किसी ने आज पहली बार सुना, उस का एक विकास और हमारे लिए इसका क्या मतलब है, इसकी एक और परिभाषा। हमारी दृष्टि वास्तव में मिथुन को सबसे व्यक्तिगत, सक्रिय और शक्तिशाली सहायक बनाने के लिए है। यही है, उपयोगकर्ताओं को अपने रोजमर्रा के जीवन के साथ मदद करना। जैसा कि हर कोई हमारे रोडमैप और प्रोजेक्ट एस्ट्रा और प्रोजेक्ट मेरिनर जैसी चीजों के बारे में सोचता है, यह इस बारे में है कि उपयोगकर्ताओं के साथ कैसे काम किया जाए और उपयोगकर्ताओं की ओर से वास्तव में उन तीन पी को एक साथ लाने के लिए वास्तव में मूल्य देने के लिए।

प्र। क्या आप मिथुन को वास्तव में सार्वभौमिक बनाने में शामिल प्रमुख तकनीकी चुनौतियों और नैतिक विचारों पर विस्तार से बता सकते हैं, और Google इन विकसित चुनौतियों और चिंताओं को कैसे संबोधित करेगा?

जैसा: मुझे लगता है कि इसके लिए शीर्ष चीजों में से एक उपयोगकर्ता प्रतिक्रिया है और उस प्रतिक्रिया पर पुनरावृत्ति करना जारी है। और यहाँ मैं अपने एआई सिद्धांतों की ओर इशारा करूँगा जो वास्तव में साहसी होने के साथ -साथ जिम्मेदार दोनों है। और तो बोल्ड का क्या मतलब है? इसका मतलब है कि हम नया कर सकते हैं। हम इस तकनीक की सीमाओं को आगे बढ़ाते हैं और जैसा कि सभी ने I/O 2025 में बहुत कुछ घोषणाओं से सुना है, हम वास्तव में इसे कैसे फ्रेम करते हैं। यहां प्रोजेक्ट एस्ट्रा है, यहां प्रोजेक्ट मेरिनर है, और यहां ये तकनीकें हैं जो सिर्फ इन नवजात अनुसंधान प्रोटोटाइप चरणों में हैं और हमारे पास विश्वसनीय परीक्षक कार्यक्रम का यह समूह है जहां हम वास्तव में प्रौद्योगिकी की दोनों शक्तियों के साथ -साथ सीमाओं का परीक्षण करने और समझने की कोशिश करते हैं। लेकिन फिर आप विकास कर सकते हैं। और मुझे लगता है कि यह वास्तव में सुंदर के मुख्य वक्ता का हिस्सा है।

वह विकास कैसे काम करता है? एस्ट्रा मिथुन लाइव जैसे अधिक आम तौर पर उपलब्ध उत्पाद में कैसे बदल जाता है? Mariner अधिक आम तौर पर उपलब्ध उत्पाद में कैसे बदल जाता है? और इसलिए उस विकास के माध्यम से जा रहा है और ऐसा है, और मैं कहूंगा, Google के बारे में बहुत पारदर्शी है कि यह अनुसंधान में क्या है। फिर उस जीवन चक्र को देखकर, जिसे कभी -कभी महीनों लग सकते हैं, कभी -कभी थोड़ा लंबा होता है, उस पारदर्शिता में मदद करता है। न केवल सार्वजनिक रूप से, बल्कि, जैसा कि मैंने उल्लेख किया है, परीक्षण जारी रखना जो हम उपयोगकर्ताओं और परीक्षकों के साथ करते हैं, वास्तव में हमारे लिए महत्वपूर्ण है।

Q. अंतर्निहित वास्तुशिल्प या प्रशिक्षण नवाचार क्या हैं जो इस स्तर के उन्नत तर्क को गहरे विचार के साथ सक्षम करते हैं, विशेष रूप से गणित, कोड और मल्टीमॉडलिटी के साथ?

जैसा: मैं कहूंगा कि कोडिंग निश्चित रूप से एक बड़ा है जिस पर हम ध्यान केंद्रित करते हैं, लेकिन यह सिर्फ बहुत सारे मूल्यांकन में वापस चला जाता है जो हम इन मॉडलों पर करते हैं, और इसलिए वे बढ़ते रहते हैं और विकसित होते हैं। मेरा मानना ​​है कि गणित, कोडिंग, मल्टीमॉडल कुछ हेडलाइनर हैं जो आपने आज देखे थे। लेकिन मूल्यांकन सेट बढ़ रहे हैं और लगातार विकसित हो रहे हैं क्योंकि हम इस तकनीक के साथ आगे बढ़ते हैं।

गहरी सोच के लिए, या जैसा कि मिथुन 2.5 मॉडल के साथ, वास्तव में सिर्फ एक मजबूत, अधिक शक्तिशाली एलएलएम है। वास्तुशिल्प रूप से यह बड़े भाषा मॉडल वास्तुकला के अनुरूप है, लेकिन यह उस क्षमता के लिए सक्षम है जो आपको इसकी विचार प्रक्रिया को 2.0 में दिखाने में सक्षम है। और फ्लैश मॉडल एक छोटे आकार के हैं। मॉडल का आकार और मॉडल की दक्षता निश्चित रूप से मायने रखती है। हमारे अधिक कुशल और अनुकूलित मॉडल के लिए, हम कहते हैं, वे सरल रोजमर्रा के कार्यों और प्रश्नों के लिए अधिक हैं और यदि आप एक मजबूत मॉडल चाहते हैं, तो आपके पास गहरी सोच वाले मॉडल में से एक का उपयोग करने के लिए उपलब्धता है जो अधिक क्षमता गहन हैं लेकिन आपको उस विचार प्रक्रिया को दिखाएंगे।

Q. मिथुन लाइव कैमरा और स्क्रीन शेयरिंग, वर्कस्पेस और क्रोम लेयर्स और एंड्रॉइड एक्सआर के साथ, उपयोगकर्ता अनुभव एक महत्वपूर्ण परिवर्तन से गुजर रहा है। यह सुनिश्चित करना कितना चुनौतीपूर्ण है कि ये नई क्षमताएं सहज हैं?

जैसा: यह एक बहुत ही महत्वपूर्ण है हर दिन का सवाल हम खुद से पूछते हैं। और विशेष रूप से उपयोगकर्ता के व्यवहार में परिवर्तन होता है, इन नई तकनीकों को अपनाना, जो शुरुआत में सहज महसूस नहीं कर सकता है क्योंकि यह पहले कभी अस्तित्व में नहीं है, हम इसे यथासंभव सहज बनाने की कोशिश करते हैं। मुझे लगता है कि एआई संचालित सहायकों की सुंदरियों में से एक प्राकृतिक भाषा है। यह वास्तव में उतना प्रचलित नहीं था, जितना कि पिछले कुछ वर्षों में है। और इसलिए आप चीजों को एक संकेत के रूप में सरल कैसे बनाते हैं? आप चीजों को वास्तव में कैसे बनाते हैं कि लोग स्वाभाविक रूप से कैसे बोलते हैं, चाहे वह भाषा के दृष्टिकोण से हो या नहीं या किसी स्टाइलिस्टिक रूप से, लोग कैसे बोलते हैं। मेरे दो छोटे बच्चे हैं, मेरा पांच साल का बच्चा मिथुन से बहुत अलग तरह से बोलता है कि मैं कैसे बोलता हूं, भले ही यह एक ही अंग्रेजी भाषा हो। और इसलिए यह सुनिश्चित करना और वास्तव में उस प्राकृतिक भाषा पर एंकरिंग करना, मुझे लगता है कि प्राकृतिक बातचीत मुझे लगता है कि आज की तकनीक में एक फायदा है।



Source

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -
Google search engine

Most Popular

Recent Comments