चीनी स्टार्ट-अप डीपसेक ने आर्टिफिशियल इंटेलिजेंस यूनिवर्स को हिला दिया

On: January 28, 2025 4:43 AM

---Advertisement---

24 जनवरी को, पेरप्लेक्सिटी ने एंड्रॉइड फोन के लिए एक सहायक जारी किया। 23 जनवरी को, ओपन एआई ने ऑपरेटर एआई एजेंट का पूर्वावलोकन किया जो “आपके लिए कार्य करने के लिए वेब पर जा सकता है”। 24 जनवरी को, मेटा ने कहा कि इसकी एआई महत्वाकांक्षाओं में एक विशाल डेटा केंद्र शामिल है। उसी दिन, Google ने कहा कि मिथुन अब एक स्मार्ट होम को नियंत्रित कर सकता है।

दीपसेक ने दावा किया है कि उसने अपने V3 मॉडल को प्रशिक्षित करने के लिए लगभग 5.5 मिलियन डॉलर खर्च किए हैं। (दीपसेक | आधिकारिक एक्स खाता)

व्यक्तिगत रूप से, प्रत्येक एआई में एक महत्वपूर्ण छलांग है; साथ में, यह और भी अधिक है।

सिवाय, 20 जनवरी को कुछ और हुआ, इन सभी ने ओवरशैड किया। चीन के अपेक्षाकृत अज्ञात डीपसेक ने एआई मॉडल की एक नई पीढ़ी लॉन्च की, जो यूएस बिग टेक द्वारा विकसित लोगों के साथ प्रतिस्पर्धा करती है, लेकिन लागत के एक अंश पर।

अचानक, हर कोई केवल दीपसेक के बारे में बात कर रहा है, जिसका लॉन्च यह भी उजागर करता है कि अमेरिकी प्रतिबंधों का मतलब था कि चीन की एआई प्रगति को धीमा करने के लिए वास्तव में काम नहीं किया है। इसमें एक सप्ताह का समय लगा, लेकिन दीपसेक के लिए ध्यान ने अपने एआई सहायक को संयुक्त राज्य अमेरिका में ऐप्पल के ऐप स्टोर पर उपलब्ध शीर्ष-रेटेड फ्री एप्लिकेशन बना दिया। ऐप ने एंड्रॉइड फोन के लिए Google के प्ले स्टोर पर एक मिलियन से अधिक डाउनलोड भी किए हैं।

इसके अलावा, दीपसेक के आसपास के उत्साह ने सोमवार को अमेरिकी बाजारों में एक रूट को उकसाया, जो 18 महीनों में बढ़ी है, जो अमेरिकी एआई कंपनियों को प्यूमेल कर रही है।

नैस्डैक ने प्रारंभिक व्यापार में 3% से अधिक की डुबकी लगाई, क्योंकि एआई की ओर दौड़ में एक अमेरिकी पेससेटर चिप दिग्गज एनवीडिया के रूप में, 13% गिर गया, बाजार मूल्य में $ 465 बिलियन की हिट – अमेरिकी बाजार के इतिहास में सबसे बड़ा।

इससे भी बदतर, दीपसेक, जो लगभग सभी मेट्रिक्स पर अन्य एआई मॉडल को आगे बढ़ाता है, जो कि प्रशिक्षण की लागत, हार्डवेयर, क्षमता और उपलब्धता तक पहुंच – अकेले नहीं है। एक अन्य चीनी फर्म मूनशॉट एआई ने किमी चैट नामक एक चैटबॉट जारी किया है, जिसमें माना जाता है कि ओपनई की नवीनतम पीढ़ी के ओ 1 लार्ज लैंग्वेज मॉडल (एलएलएम) के समान क्षमताएं हैं।

दीपसेक ने अपने वी 3 मॉडल को प्रशिक्षित करने के लिए लगभग 5.5 मिलियन डॉलर खर्च करने का दावा किया है, एक ही परिणाम देने के लिए काफी मितव्ययी दृष्टिकोण है, जिसने Google, Openai, मेटा और अन्य लोगों की पसंद को प्राप्त किया, जो सैकड़ों लाखों डॉलर निवेश को प्राप्त करने के लिए थे।

Epoch.ai के शोध के अनुसार, Google और Openai ने 2023 में क्रमशः $ 70 मिलियन और $ 100 मिलियन के बीच मिथुन 1.0 अल्ट्रा और GPT-4 फ्रंटियर मॉडल को प्रशिक्षित करने के लिए खर्च किया।

दीपसेक द्वारा जारी की गई जानकारी से जो कुछ है, वह हार्डवेयर की मितव्ययिता भी है।

“मुझे NVIDIA A100 और H100 GPU के संयोजन पर प्रशिक्षित किया गया था,” दीपसेक चैटबॉट हमें बताता है। यह एक सटीक संख्या साझा नहीं करता है, और यह R1 मॉडल के लिए विशिष्ट है।

दीपसेक के सीईओ लियांग वेनफेंग एक अरबपति हैं, जो एक हेज फंड चलाते हैं और डीपसेक को वित्तपोषित कर रहे हैं, जिसने कथित तौर पर अन्य चीनी तकनीकी कंपनियों से शीर्ष प्रतिभा को काम पर रखा है, जिसमें बाईडेंस और टेन्सेंट शामिल हैं।

यह सुनिश्चित करने के लिए, दीपसेक स्पष्ट रूप से चीन पर अपनी प्रतिक्रियाओं के बारे में सावधान है।

उदाहरण के लिए, इस लेखक के एक प्रश्न के जवाब में, चुनौतियों की एक सूची में, मानवाधिकारों सहित, चीन का सामना करना, दीपसेक ने इंटरनेट सेंसरशिप, शहरी-ग्रामीण विभाजन, आवास बाजार की जटिलताओं और शिनजियांग में उइघुर मुसलमानों के उपचार सहित कई सूचीबद्ध कई सूचीबद्ध हैं। , इससे पहले कि इसे मिटा दिया गया और एक सरल “” क्षमा करें, यह मेरे वर्तमान दायरे से परे है। चलो कुछ अलग से इसके बारे मे बात करते है।”

यह चीन के सामने आर्थिक चुनौतियों पर और भारत और अमेरिका द्वारा सामना की जाने वाली आर्थिक और सामाजिक चुनौतियों पर भी बहुत अधिक आगामी था।

दीपसेक, यह उभरता है, अब कुछ समय के लिए इस पर रहा है, बस यह कि कोई भी वास्तव में नहीं देख रहा था। डीपसेक कोडर को 2023 के अंत में जारी किया गया था, और 2024 के माध्यम से, इसके बाद 67 बिलियन पैरामीटर डीपसेक एलएलएम, डीपसेक वी 2, एक अधिक उन्नत डीपसेक कोडर वी 2 236 बिलियन मापदंडों के साथ, 671 बिलियन पैरामीटर डीपसेक वी 3 और साथ ही साथ साथ ही साथ जारी किया गया था। डीपसेक आर 1 के 32 बिलियन और 70 बिलियन मॉडल।

“एक बजट का एक मजाक,” कैसे आंद्रेज करपथी, यूरेखलाबसाई के संस्थापक, कंपनी की यह सब अपने प्रशिक्षण खर्च के साथ यह सब करने की उपलब्धि का वर्णन करते हैं। वह केवल एक ही नहीं है।

“डीपसेक अब ऐप स्टोर पर नंबर 1 है, चैट को पार कर रहा है – कोई एनवीडिया सुपर कंप्यूटर या $ 100 मीटर की जरूरत नहीं है। एआई का असली खजाना यूआई या मॉडल नहीं है – वे वस्तु बन गए हैं। वास्तविक मूल्य डेटा और मेटाडेटा में निहित है, ऑक्सीजन एआई की क्षमता को ईंधन दे रहा है, ”सेल्सफोर्स के सीईओ मार्क बेनिओफ ने एक्स पर एक पोस्ट में लिखा।

विश्लेषक पहले से ही एआई अर्थशास्त्र के टिपिंग पॉइंट कह रहे हैं। यह देखना आसान है कि क्यों: डीपसेक आर 1 के एपीआई की लागत $ 0.55 प्रति मिलियन प्रति मिलियन इनपुट टोकन और $ 2.19 प्रति मिलियन आउटपुट टोकन है। इसकी तुलना में, Openai के API की लागत आमतौर पर $ 15 प्रति मिलियन इनपुट और $ 60 प्रति मिलियन आउटपुट टोकन होती है।

Openai के O1 मॉडल की तरह, R1 भी प्रबलित सीखने, या RL का उपयोग करता है। इसका मतलब है, मॉडल एल्गोरिथम पुरस्कारों के माध्यम से परीक्षण और त्रुटि और आत्म-सुधार के माध्यम से सीखते हैं, कुछ ऐसा जो तर्क क्षमताओं को विकसित करता है। मॉडल उनकी बातचीत के आधार पर प्रतिक्रिया प्राप्त करके सीखते हैं।

R1 के साथ, दीपसेक ने AI मॉडल के लिए पारंपरिक दृष्टिकोण को पुनः प्राप्त किया। पारंपरिक जनरेटिव और प्रासंगिक एआई यूएसईएस 32-बिट फ्लोटिंग पॉइंट्स (एक फ्लोटिंग पॉइंट बड़ी और छोटी संख्या को एनकोड करने का एक तरीका है)। दीपसेक का दृष्टिकोण सटीकता से समझौता किए बिना, 8-बिट फ़ॉलिंग पॉइंट का उपयोग करता है। वास्तव में, यह कई कार्यों में GPT-4 और क्लाउड से बेहतर है। परिणाम, एआई को चलाने के लिए 75% कम मेमोरी की आवश्यकता थी।

फिर बहु-टोकन प्रणाली है जो संपूर्ण वाक्यांशों को पढ़ती है और एक पर शब्दों का सेट, अनुक्रम के बजाय और एक-एक करके। इसका मतलब है कि AI दो बार तेजी से जवाब देने में सक्षम होगा।

दीपसेक के मिश्रण-के-विशेषज्ञ (एमओई) भाषा मॉडल एक विकास भी है। उदाहरण के लिए, डीपसेक वी 3, कुल 671 बिलियन मापदंडों के साथ, प्रत्येक टोकन के लिए 37 बिलियन मापदंडों को सक्रिय करेगा – कुंजी है, ये पैरामीटर उस विशिष्ट टोकन के लिए सबसे अधिक प्रासंगिक हैं।

“एक बड़े पैमाने पर एआई के बजाय सब कुछ जानने की कोशिश कर रहा है (जैसे कि एक व्यक्ति एक डॉक्टर, वकील, और इंजीनियर होना), उनके पास विशेष विशेषज्ञ हैं जो केवल जरूरत पड़ने पर जागते हैं,” मॉर्गन ब्राउन, उत्पाद और विकास के वीपी बताते हैं – एआई, एआई, एआई, ड्रॉपबॉक्स पर। पारंपरिक मॉडल प्रत्येक टोकन और क्वेरी के लिए सभी मापदंडों को सक्रिय रखते हैं।

बेशक, दीपसेक, मूनशॉट एआई और चीन की अन्य सभी तकनीकी कंपनियों से जुड़ी आशंका है। किसी भी चीनी टेक कंपनी की निकटता (ज्ञात, या अन्यथा) के बारे में प्रश्न सरकार के साथ हमेशा स्पॉटलाइट में होंगे जब यह डेटा साझा करने की बात आती है।

सामान्य रूप से नवीनतम पीढ़ी के जीपीयू और एआई चिप्स के लिए चीनी टेक की पहुंच के बारे में स्पष्टता की कमी भी है। सेमियालिसिस ‘डायलन पटेल का अनुमान है कि डीपसेक में 50,000 एनवीडिया जीपीयू हैं, और 10,000 नहीं हैं जैसा कि कुछ ऑनलाइन बकबक सुझाव देते हैं।

NVIDIA A100 (लगभग $ 16,000 प्रत्येक, 2020 में लॉन्च किया गया) और H100 (2022 में लॉन्च किया गया $ 30,000 चिप) सिलिकॉन वैली की पहुंच की तुलना में एज चिप्स को काट नहीं रहे हैं, लेकिन यह स्पष्ट नहीं है कि एक चीनी तकनीक कंपनी कैसे रखी गई है। उन पर हाथ।

कंपनी ने आधिकारिक तौर पर इन बारीकियों को विस्तृत नहीं किया है। यह संभावना नहीं है कि अगर दुनिया हर उस सभी हार्डवेयर को जान लेगी जो खेल में था, और यह कैसे खट्टा था। हालांकि, यह आर 1 बनाने की सही लागत को प्रकट कर सकता है, और इससे पहले कि मॉडल।

Source

एआई मॉडल,एआई सहायक,एंड्रॉइड फ़ोन,ओपन एआई,खेल स्टोर,लिआंग वेनफेंग

चीनी स्टार्ट-अप डीपसेक ने आर्टिफिशियल इंटेलिजेंस यूनिवर्स को हिला दिया

Dhiraj Singh

Join WhatsApp

Join Telegram

Related Post

एलोन मस्क के XAI ने 500 श्रमिकों को प्रशिक्षण ग्रोक के साथ काम सौंपा। क्या छंटनी ईमेल ने कहा

Openai के सैम अल्टमैन ने व्हिसलब्लोअर सुचिर बालाजी की मौत पर चुप्पी तोड़ दी: ‘वह मेरे एक दोस्त की तरह था’

Apple इवेंट 2025: Apple की $ 430 बिलियन रैली का सामना उत्पाद अनावरण की जांच

सरकार कंपनियों को नई जीएसटी दरों के अनुसार अनसोल्ड स्टॉक पर एमआरपी को बदलने की अनुमति देती है

जेएलआर इंडिया आज से लक्जरी कारों, एसयूवी पर पूर्ण जीएसटी लाभों पर पारित करने के लिए

‘दर्द हमारे पीछे है’, उज्जिवन स्मॉल फाइनेंस बैंक के सीईओ का कहना है कि ₹ 2,000 करोड़ क्यूआईपी के लिए योजनाओं के बीच

Leave a Comment Cancel reply

Recent Post

पीएम मोदी सोमवार को पोल-बाउंड बिहार का दौरा करने के लिए: पूर्णिया हवाई अड्डे, एजेंडा पर मखना बोर्ड

मिराई बॉक्स ऑफिस कलेक्शन डे 3: तेजा सज्जजा फिल्म में रविवार को एक तारकीय है, ₹ 45 करोड़ एकत्र करता है

GEMINI AI साड़ी तस्वीरें: यहां बताया गया है कि कैसे अपनी सेल्फी को लाल साड़ी रेट्रो बॉलीवुड पोस्टर में बदल दें

रिकी हैटन का बेटा कैंपबेल कौन है और वह 24 में मुक्केबाजी से क्यों रिटायर हुआ?

महिला हॉकी: एशिया कप फाइनल में चीन द्वारा भारतीय चैलेंज को चुना गया

5.8 परिमाण का भूकंप असम, 2 लड़कियों को घायल करता है

Categories

Quakes Links

Follow Us