हाल के सप्ताहों में अमेरिकी कंपनियों में उछाल आया है एआई की लागत बढ़ रही हैकभी-कभी प्रति कर्मचारी हजारों डॉलर तक सीमित होता है। कुछ संगठन टोकन (एक मॉडल द्वारा संसाधित पाठ के टुकड़े) के लिए बजट बना रहे हैं। फिर 12 जून को ट्रम्प प्रशासन ने गैर-अमेरिकियों को फ़ेबल 5 का उपयोग करने से प्रतिबंधित कर दिया, जिससे एंथ्रोपिक की सभी तक पहुंच बंद हो गई। पहली बार, सीमा एआई तक पहुंच अमेरिकी सरकार के वचन पर निर्भर करती है। यह सब उपयोगकर्ताओं को अमेरिकी एआई के विकल्पों पर विचार करने का कारण दे सकता है। कई लोग glm 5.2 को सक्षम, किफायती और ट्रम्प प्रशासन की पहुंच से बाहर के रूप में स्वागत करेंगे।
सामर्थ्य से शुरुआत करें. आर्टिफिशियल एनालिटिक्स, एक शोध फर्म, बाज़ार में सबसे बुद्धिमान ओपन सोर्स मॉडल के रूप में glm 5.2 को रैंक करती है। glm 5.2 अपनी समग्र सूची में प्रभावशाली चौथे स्थान पर है, Openai के Chatgpt 5.5 के पीछे और Google के जेमिनी बॉट से आगे। मॉडल ने सभी को हैरान कर दिया. इस साल की शुरुआत में चीनी डेवलपर्स 2030 से पहले अपने मॉडलों के अमेरिकी मॉडलों से आगे निकलने की संभावना को लेकर निराशावादी थे। झिपु की रिलीज़ के बाद, एक बहुत अमीर आदमी, एलोन मस्क ने अपनी सोशल-मीडिया साइट एक्स पर लिखा था कि उन्हें उम्मीद है कि चीन अगले साल की शुरुआत में मौजूदा सीमा शक्तियों की बराबरी कर लेगा। झिपु के सह-संस्थापक तांग जी ने पलटवार करते हुए कहा, “इसमें इतना समय नहीं लगेगा।”
निराशाजनक क्षण के विपरीत, अमेरिकी बाजारों ने अब तक जीएलएम 5.2 में बहुत कम रुचि दिखाई है। इसका आंशिक कारण यह है कि चीनी मॉडलों की क्षमताओं का सटीक आकलन करना अधिक कठिन हो गया है। अपने अनुमान पर पहुंचने के लिए, आर्टिफिशियल इंटेलिजेंस ने दर्जनों बेंचमार्क परीक्षणों पर जीएलएम 5.2 स्कोर किया, जो एक मॉडल की स्मार्टनेस का आकलन करने के लिए परीक्षण जैसे प्रश्नों का उपयोग करते हैं। एंथ्रोपिक के जरिए अमेरिका ने प्रदर्शन में अपनी बढ़त बरकरार रखी है. औसत बेंचमार्क कार्यों में Fable 5 glm 5.2 से लगभग 17% अधिक स्मार्ट है। अन्य महत्वपूर्ण मीट्रिक यह है कि बुद्धिमत्ता के इस स्तर तक पहुँचने में glm 5.2 को कितना समय लगा। जीएलएम 5.2 के साथ एक तुलनीय पश्चिमी मॉडल फरवरी में, या लगभग चार महीने पहले जारी किया गया था।
वास्तव में, अमेरिका की बढ़त संभवतः चार महीने से अधिक है। नॉर्वे में एक थिंक-टैंक, नॉर्वेजियन डिफेंस रिसर्च एस्टैब्लिशमेंट के हावर्ड ट्वेइट इहले ने कहा, ओपन-सोर्स मॉडल, जिनमें से कई चीनी हैं, निजी मॉडल की तुलना में सार्वजनिक बेंचमार्क पर बेहतर स्कोर करते हैं। सार्वजनिक बेंचमार्क परीक्षणों में उपयोग किए गए प्रश्न प्रकाशित किए जाते हैं, जबकि निजी बेंचमार्क कार्यान्वयनकर्ता अपने मूल्यांकन को निजी रखते हैं। जीएलएम 5.2 से पहले प्रकाशित डॉ. ट्वेइट इहले के विश्लेषण में पाया गया कि सार्वजनिक परीक्षणों में चीनी मॉडल अमेरिकी मॉडलों से लगभग चार से छह महीने पीछे रह गए। लेकिन व्यक्तिगत परीक्षणों में, आठ से 10 महीनों में अमेरिका की बढ़त लगभग दोगुनी हो गई (चार्ट देखें)। मई में जारी अमेरिकी सरकार के एक अध्ययन में इसी तरह के अंतर की पहचान की गई। डॉ. त्वेइट इहले का कहना है कि चीनी प्रयोगशालाएँ शायद अनजाने में “परीक्षण सिखाती हैं”।
अब तक परीक्षण किए गए दो निजी बेंचमार्क में, जीएलएम 5.2 समान बानगी दिखाता है: यह वेर्डएमएल से लगभग सात महीने पीछे है, असामान्य मशीन-लर्निंग कार्यों का एक उपाय जिसे हल करने के लिए सावधानीपूर्वक तर्क की आवश्यकता होती है, और सिंपलबेंच से पूरी तरह से एक साल पीछे है, जो मॉडलों को मात देने की कोशिश करके सामान्य ज्ञान का आकलन करता है। हालाँकि, पैटर्न सुसंगत नहीं है। 19 जून को आर्टिफिशियल इंटेलिजेंस द्वारा प्रकाशित एक नया प्रयोग कार्यालय कर्मचारियों के कामकाजी मॉडल की जांच करता है, जैसे कि गंदी फाइलों को छांटना और परस्पर विरोधी जानकारी का मूल्यांकन करना। जीएलएम 5.2 मूल्यांकन के लिए प्रशिक्षित नहीं हो सका। यह अभी भी Chatgpt 5.5 से बेहतर प्रदर्शन करता है, जो केवल दो महीने पुराना है। डॉ. टोविट इहले ने कहा, इन नतीजों से संकेत मिलता है कि अमेरिका की बढ़त स्थिर बनी हुई है, लेकिन यह इस बात का भी सबूत है कि अंतर उतना नहीं बढ़ रहा है, जितनी कुछ लोगों को उम्मीद थी।
जीएलएम 5.2 के बारे में विशेष रूप से आश्चर्य की बात यह है कि यह उन कार्यों में सफल होता है जो अपने साथियों से आगे निकल जाते हैं। चीनी मॉडल अक्सर गणित और कोडिंग जैसे स्पष्ट सही या गलत उत्तर वाले क्षेत्रों में उत्कृष्टता प्राप्त करते हैं। लेकिन वे उन मुद्दों पर ध्यान केंद्रित करते हैं जो खुले हैं या जिनके लिए निरंतर स्वतंत्र निर्णय की आवश्यकता है। यह पैटर्न चीन में शोधकर्ताओं के सामने सबसे बड़ी चुनौतियों में से एक को दर्शाता है। उन्नत चिप्स पर निर्यात नियंत्रण ने चीनी प्रयोगशालाओं को शक्तिशाली मॉडलों को प्रशिक्षित करने के लिए आवश्यक कंप्यूटिंग शक्ति कम कर दी है। इसलिए वे प्रशिक्षण के बाद का निर्माण करते हैं: फाइन-ट्यूनिंग मॉडल जो विशेष तरीकों से व्यवहार करते हैं या विशेष प्रकार की समस्याओं को हल करते हैं, जिसमें “आसवन” नामक प्रक्रिया के माध्यम से अमेरिकी सिस्टम से प्राप्त डेटा भी शामिल है।
चीनी मॉडलों की वास्तविक क्षमताओं को लेकर अनिश्चितता को देखते हुए, आगे विचार करें कि क्या वे वास्तव में अपने अमेरिकी प्रतिद्वंद्वियों से सस्ते हैं। डिप्सिक अपने वी4 मॉडल के लिए केवल $0.87 प्रति 1 मिलियन आउटपुट टोकन चार्ज करता है, जबकि एंथ्रोपिक फ़ेबल 5 पर समान कीमत के लिए $50 चार्ज करता है। ऐसी कीमतों का अमेरिका में आकर्षण बढ़ सकता है, जहां कुछ कंपनियों का टोकन खर्च नियंत्रण से बाहर हो गया है। रैम्प के अनुसार, इनवॉइसिंग कंपनी डिप्सिक ने जून में अमेरिकी कंपनियों द्वारा सेवाओं के लिए भुगतान में तेज वृद्धि देखी। कथित तौर पर माइक्रोसॉफ्ट अपने प्रमुख कोपायलट चैटबॉट में चीनी लैब मॉडल का उपयोग करने पर विचार कर रहा है। फिर भी यह सबसे महत्वपूर्ण धारणा, कि चीनी एआई सस्ता है, अक्सर गलत हो सकती है।
जबकि चीनी मॉडल अधिक सक्षम हो रहे हैं, वे आम तौर पर अधिक कुशल नहीं बन रहे हैं। चीनी मॉडल अपने उत्तरों पर विचार करने के लिए कई और टोकन का उपयोग करते हैं। जॉर्जिया टेक के डु झेंग और सह-लेखकों द्वारा इस महीने अद्यतन किए गए एक अध्ययन से पता चलता है कि समान कार्यों को देखते हुए, डिपसिक मॉडल अनिवार्य रूप से समान परिणाम प्राप्त करने के लिए अपने ओपनएआई प्रतिद्वंद्वी की तुलना में 23 गुना अधिक टोकन का उपयोग करता है। दक्षता में इन बड़े अंतरों के कारण, मॉडलों की तुलना करने का सही तरीका प्रति टोकन की कीमत नहीं है, बल्कि उपयोग किए गए सभी टोकन की कुल लागत है। सॉफ़्टवेयर इंजीनियरिंग का परीक्षण करने के लिए डिज़ाइन किए गए बेंचमार्क पर, इस मीट्रिक का उपयोग करते हुए, जीएलएम 5.2 ने एंथ्रोपिक और ओपनएआई के प्रतिस्पर्धी सिस्टम से बेहतर प्रदर्शन किया।
सामर्थ्य और लागत के अलावा, एक तीसरा विक्रय बिंदु अब एआई उपयोगकर्ताओं के दिमाग में सबसे ऊपर है: विश्वसनीयता। ट्रम्प प्रशासन द्वारा एंथ्रोपिक को बताए जाने के एक दिन बाद कि वह गैर-अमेरिकियों को कल्पित 5 का उपयोग करने से रोक रहा है, झिपू ने 13 जून को बीजिंग समयानुसार शाम 5:21 बजे अपना मॉडल जारी किया। श्री तांग ने घोषणा की, “हमारा रवैया कट्टरपंथी खुलेपन में से एक है।”
अधिकांश चीनी मॉडल ओपन-सोर्स जारी किए गए हैं, जिसका अर्थ है कि उन्हें सरकारों या प्रयोगशालाओं की पहुंच से बाहर, स्थानीय हार्डवेयर पर डाउनलोड और चलाया जा सकता है। अमेरिकी सरकार एक दिन चीनी एआई के घरेलू उपयोग पर सीमा लगा सकती है। कांग्रेस की दो समितियाँ वर्तमान में चीनी मॉडलों का उपयोग करने के लिए अमेरिकी प्रौद्योगिकी कंपनियों की जाँच कर रही हैं। चीन की प्रयोगशालाएँ अपनी विश्वसनीयता की अन्य सीमाओं का सामना करती हैं: कंप्यूटिंग शक्ति की कमी का मतलब है कि वे अक्सर उच्च ट्रैफ़िक के दौरान सेवा में रुकावट का अनुभव करते हैं या धीमी हो जाती हैं।
हालाँकि, जैसे-जैसे एआई की दौड़ तेज़ होती जा रही है, हर जगह नियामकों को सुरक्षा और संरक्षा के लिए नई चुनौतियों का सामना करना पड़ेगा। प्रशांत महासागर के दोनों किनारों पर अचानक सरकारी हस्तक्षेप का जोखिम बढ़ सकता है। फेयरीटेल 5 व्हाइट हाउस से ऐसी प्रतिक्रिया की गारंटी देने के लिए काफी मजबूत था। चीनी मॉडल फिलहाल समान नियामक जोखिमों के अधीन नहीं हैं, यह बताता है कि चीनी सरकार अभी भी कार्रवाई करने के लिए पर्याप्त रूप से चिंतित नहीं है। यह उनके प्रतिद्वंद्वियों से पिछड़ने का कोई स्पष्ट प्रमाण हो सकता है.