चीन की डीपसीक वैश्विक तकनीक को हिला देने के बाद अपने दावों पर सवालों का सामना कर रही है
Google और OpenAI जैसी क्षमताओं वाले AI मॉडल के साथ सनसनी मचाने के बाद, चीन की डीपसीक इस बात को लेकर सवालों का सामना कर रही है कि क्या उसके साहसिक दावे जांच के दायरे में आते हैं।
हांग्जो स्थित स्टार्टअप की घोषणा कि उसने सिलिकॉन वैली के नवीनतम मॉडलों की लागत के एक अंश पर R1 विकसित किया है, ने तुरंत AI में संयुक्त राज्य अमेरिका के प्रभुत्व और इसकी शीर्ष तकनीकी फर्मों के आसमान छूते बाजार मूल्यांकन के बारे में धारणाओं पर सवाल खड़े कर दिए।
हालांकि, कुछ संशयवादियों ने डीपसीक के कम बजट पर काम करने के विवरण को चुनौती दी है, यह सुझाव देते हुए कि फर्म के पास संभवतः अधिक उन्नत चिप्स और अधिक फंडिंग तक पहुंच थी, जितना उसने स्वीकार किया है।
वाशिंगटन विश्वविद्यालय में कंप्यूटर विज्ञान और इंजीनियरिंग के प्रोफेसर एमेरिटस पेड्रो डोमिंगोस ने अल जजीरा को बताया, “यह एक खुला प्रश्न है कि क्या डीपसीक के दावों को सच माना जा सकता है। AI समुदाय उनकी जांच करेगा और हम पता लगाएंगे।” डोमिंगोस ने कहा, “मेरे हिसाब से यह संभव है कि वे 6 मिलियन डॉलर में मॉडल को प्रशिक्षित कर सकें।” “लेकिन यह भी संभव है कि यह केवल फाइन-ट्यूनिंग और पोस्ट-प्रोसेसिंग मॉडल की लागत है, जिसकी लागत अधिक है, डीपसीक दूसरों के अधिक महंगे मॉडल के निर्माण के बिना ऐसा नहीं कर सकता था।”
पिछले सप्ताह जारी एक शोध पत्र में, डीपसीक विकास दल ने कहा कि उन्होंने 2,000 एनवीडिया एच800 जीपीयू का उपयोग किया था – एक कम उन्नत चिप जिसे मूल रूप से अमेरिकी निर्यात नियंत्रणों का अनुपालन करने के लिए डिज़ाइन किया गया था – और आर1 के आधारभूत मॉडल, वी3 को प्रशिक्षित करने के लिए 5.6 मिलियन डॉलर खर्च किए। ओपनएआई के सीईओ सैम ऑल्टमैन ने कहा है कि इसके चैटबॉट जीपीटी-4 को प्रशिक्षित करने में 100 मिलियन डॉलर से अधिक की लागत आई, जबकि विश्लेषकों ने अनुमान लगाया है कि मॉडल में 25,000 से अधिक उन्नत एच100 जीपीयू का उपयोग किया गया था।
सीरियल उद्यमी लियांग वेनफेंग द्वारा 2023 के अंत में स्थापित डीपसीक की घोषणा ने व्यापक रूप से प्रचलित धारणा को उलट दिया कि एआई के क्षेत्र में सबसे आगे रहने की चाह रखने वाली कंपनियों को डेटा सेंटर और बड़ी मात्रा में महंगे हाई-एंड चिप्स में अरबों डॉलर का निवेश करने की आवश्यकता है।
इसने सबसे उन्नत चिप्स के निर्यात पर प्रतिबंध लगाकर चीन के एआई क्षेत्र को बाधित करने के वाशिंगटन के प्रयासों की प्रभावशीलता पर भी सवाल उठाए।
कैलिफ़ोर्निया स्थित एनवीडिया के शेयर, जो जेनरेटिव एआई को शक्ति देने वाले जीपीयू की आपूर्ति पर लगभग एकाधिकार रखते हैं, सोमवार को 17 प्रतिशत गिर गए, जिससे चिप दिग्गज के बाजार मूल्य से लगभग $593 बिलियन का सफाया हो गया – यह आंकड़ा स्वीडन के सकल घरेलू उत्पाद (जीडीपी) के बराबर है।
जबकि इस बात पर व्यापक सहमति है कि डीपसीक द्वारा आर1 की रिलीज़ कम से कम एक महत्वपूर्ण उपलब्धि का प्रतिनिधित्व करती है, कुछ प्रमुख पर्यवेक्षकों ने इसके दावों को सच मानने के खिलाफ चेतावनी दी है।
वर्चुअल रियलिटी कंपनी ओकुलस वीआर के संस्थापक पामर लुकी ने बुधवार को डीपसीक के दावे वाले बजट को “फर्जी” करार दिया और कई “उपयोगी बेवकूफों” पर “चीनी प्रचार” के झांसे में आने का आरोप लगाया।
लकी ने एक्स पर एक पोस्ट में कहा, “यह एक चीनी हेज फंड द्वारा अमेरिकी एआई स्टार्टअप में निवेश को धीमा करने, एनवीडिया जैसे अमेरिकी दिग्गजों के खिलाफ अपने स्वयं के शॉर्ट्स की सेवा करने और प्रतिबंध चोरी को छिपाने के लिए किया गया है।”
“अमेरिका इस तरह के मनोवैज्ञानिक हमलों के लिए एक उपजाऊ बिस्तर है क्योंकि हमारा मीडिया तंत्र हमारी प्रौद्योगिकी कंपनियों से नफरत करता है और राष्ट्रपति ट्रम्प को विफल होते देखना चाहता है।”
पिछले हफ्ते सीएनबीसी के साथ एक साक्षात्कार में, स्केल एआई के सीईओ एलेक्जेंडर वांग ने भी डीपसीक के खाते पर संदेह जताते हुए कहा कि यह उनकी “समझ” थी कि इसके पास 50,000 से अधिक उन्नत एच100 चिप्स तक पहुंच थी, जिसके बारे में वह अमेरिकी निर्यात नियंत्रण के कारण बात नहीं कर सकते थे।
वांग ने अपने दावे के लिए सबूत नहीं दिए। अमेरिकी राष्ट्रपति डोनाल्ड ट्रंप के सबसे करीबी विश्वासपात्रों में से एक, टेक अरबपति एलन मस्क ने डीपसीक के संदेहियों का समर्थन करते हुए वांग के दावे के बारे में एक पोस्ट के तहत एक्स पर “स्पष्ट रूप से” लिखा।
डीपसीक ने टिप्पणी के अनुरोधों का जवाब नहीं दिया।
लेकिन डीपसीक के पहले मॉडल पर काम करने वाले पीएचडी उम्मीदवार जिहान वांग ने स्टार्टअप के आलोचकों पर पलटवार करते हुए कहा, “बात करना सस्ता है।”
“आलोचना करना आसान है,” वांग ने एक्स पर अल जज़ीरा के सवालों के जवाब में कहा कि डीपसीक के दावों को अंकित मूल्य पर नहीं लिया जाना चाहिए।
“अगर वे कोड पर काम करने में अधिक समय लगाते और डीपसीक के विचार को खुद ही दोहराते तो यह कागज पर बात करने से बेहतर होता,” वांग ने बेकार की बातें करने वाले लोगों के बारे में एक चीनी मुहावरे का अंग्रेजी अनुवाद करते हुए कहा।
उन्होंने इस सवाल का सीधा जवाब नहीं दिया कि क्या उन्हें लगता है कि डीपसीक ने आर1 के आधारभूत मॉडल को प्रशिक्षित करने के लिए $6 मिलियन से कम खर्च किया है और कम उन्नत चिप्स का उपयोग किया है।
चीनी मीडिया आउटलेट वेव्स के साथ 2023 के एक साक्षात्कार में, लियांग ने कहा कि उनकी कंपनी ने तत्कालीन अमेरिकी राष्ट्रपति जो बिडेन के प्रशासन द्वारा उनके निर्यात पर प्रतिबंध लगाने से पहले Nvidia के A100 चिप्स के 10,000 स्टॉक किए थे – जो H800 से पुराने हैं।
R1 के उपयोगकर्ता चीन में इसकी उत्पत्ति के कारण इसके सामने आने वाली सीमाओं की ओर भी इशारा करते हैं, अर्थात् बीजिंग द्वारा संवेदनशील माने जाने वाले विषयों पर सेंसरशिप, जिसमें 1989 में तियानमेन स्क्वायर में नरसंहार और ताइवान की स्थिति शामिल है।
इस बात के संकेत में कि डीपसीक के अमेरिकी तकनीकी क्षेत्र पर संभावित प्रभाव के बारे में शुरुआती घबराहट कम होने लगी है, मंगलवार को Nvidia के शेयर की कीमत में लगभग 9 प्रतिशत की वृद्धि हुई।
तकनीक-भारी नैस्डैक 100 पिछले दिन 3 प्रतिशत से अधिक गिरने के बाद 1.59 प्रतिशत बढ़ा।
यूनिवर्सिटी ऑफ क्वींसलैंड में AI में विशेषज्ञता रखने वाले प्रोफेसर टिम मिलर ने कहा कि यह कहना मुश्किल है कि डीपसीक के दावों पर कितना भरोसा किया जाना चाहिए।
मिलर ने अल जज़ीरा को बताया, “मॉडल खुद ही कुछ विवरण देता है कि यह कैसे काम करता है, लेकिन वे जिन मुख्य परिवर्तनों का दावा करते हैं, उनकी लागत – जो मैं समझता हूँ – मॉडल में इतनी अधिक नहीं दिखती है।” मिलर ने कहा कि उन्होंने कोई “खतरे की घंटी” नहीं देखी है, लेकिन शोध पत्र पर भरोसा करने के पक्ष और विपक्ष में उचित तर्क हैं। मिलर ने कहा, “यह सफलता अविश्वसनीय है – लगभग ‘सच होने के लिए बहुत अच्छा’ शैली। लागतों का विभाजन स्पष्ट नहीं है।” दूसरी ओर, उन्होंने कहा, कंप्यूटर विज्ञान में कभी-कभी सफलताएँ मिलती हैं। मिलर ने कहा, “ये बड़े पैमाने के मॉडल बहुत हाल की घटना हैं, इसलिए दक्षताएँ मिलना तय है।” “चूँकि वे जानते थे कि इसे दूसरों के लिए पुनरुत्पादित करना काफी सरल होगा, इसलिए उन्हें पता होगा कि अगर वे सभी को बेवकूफ़ बनाएँगे तो वे बेवकूफ़ लगेंगे। काम को पुनरुत्पादित करने की कोशिश करने के लिए पहले से ही एक टीम प्रतिबद्ध है।” लागत में गिरावट गैर-लाभकारी संस्था CivAI के सह-संस्थापक लुकास हैनसेन ने कहा कि हालांकि यह जानना मुश्किल था कि डीपसीक ने अमेरिकी निर्यात नियंत्रणों को दरकिनार किया या नहीं, स्टार्टअप के दावा किए गए प्रशिक्षण बजट में V3 का उल्लेख था, जो कि OpenAI के GPT-4 के बराबर है, न कि R1 के बराबर।
“GPT-4 ने 2022 के अंत में प्रशिक्षण पूरा कर लिया। 2022 के बाद से बहुत सारे एल्गोरिदम और हार्डवेयर सुधार हुए हैं, जिससे GPT-4 क्लास मॉडल को प्रशिक्षित करने की लागत कम हो गई है। GPT-2 के लिए भी ऐसी ही स्थिति हुई। उस समय इसे प्रशिक्षित करना एक गंभीर उपक्रम था, लेकिन अब आप इसे 90 मिनट में $20 में प्रशिक्षित कर सकते हैं,” हैनसेन ने अल जज़ीरा को बताया। “डीपसीक ने एक बेस मॉडल – इस मामले में, V3 – लेकर और उस बेस मॉडल को अधिक सावधानी से सोचना सिखाने के लिए कुछ चतुर तरीकों को लागू करके R1 बनाया,” हैनसेन ने कहा। “बेस मॉडल को प्रशिक्षित करने की कीमत की तुलना में यह शिक्षण प्रक्रिया तुलनात्मक रूप से सस्ती है। अब जबकि डीपसीक ने आधार मॉडल को चिंतन मॉडल में बदलने के बारे में विवरण प्रकाशित कर दिया है, तो हम बड़ी संख्या में नए चिंतन मॉडल देखेंगे।”