Sunday, February 23, 2025

वैश्विक तकनीक को हिला देने वाले दावों पर चीन की DeepSeek पर सवाल

चीन की डीपसीक वैश्विक तकनीक को हिला देने के बाद अपने दावों पर सवालों का सामना कर रही है

Google और OpenAI जैसी क्षमताओं वाले AI मॉडल के साथ सनसनी मचाने के बाद, चीन की डीपसीक इस बात को लेकर सवालों का सामना कर रही है कि क्या उसके साहसिक दावे जांच के दायरे में आते हैं।

हांग्जो स्थित स्टार्टअप की घोषणा कि उसने सिलिकॉन वैली के नवीनतम मॉडलों की लागत के एक अंश पर R1 विकसित किया है, ने तुरंत AI में संयुक्त राज्य अमेरिका के प्रभुत्व और इसकी शीर्ष तकनीकी फर्मों के आसमान छूते बाजार मूल्यांकन के बारे में धारणाओं पर सवाल खड़े कर दिए।

हालांकि, कुछ संशयवादियों ने डीपसीक के कम बजट पर काम करने के विवरण को चुनौती दी है, यह सुझाव देते हुए कि फर्म के पास संभवतः अधिक उन्नत चिप्स और अधिक फंडिंग तक पहुंच थी, जितना उसने स्वीकार किया है।

वाशिंगटन विश्वविद्यालय में कंप्यूटर विज्ञान और इंजीनियरिंग के प्रोफेसर एमेरिटस पेड्रो डोमिंगोस ने अल जजीरा को बताया, “यह एक खुला प्रश्न है कि क्या डीपसीक के दावों को सच माना जा सकता है। AI समुदाय उनकी जांच करेगा और हम पता लगाएंगे।” डोमिंगोस ने कहा, “मेरे हिसाब से यह संभव है कि वे 6 मिलियन डॉलर में मॉडल को प्रशिक्षित कर सकें।” “लेकिन यह भी संभव है कि यह केवल फाइन-ट्यूनिंग और पोस्ट-प्रोसेसिंग मॉडल की लागत है, जिसकी लागत अधिक है, डीपसीक दूसरों के अधिक महंगे मॉडल के निर्माण के बिना ऐसा नहीं कर सकता था।”

पिछले सप्ताह जारी एक शोध पत्र में, डीपसीक विकास दल ने कहा कि उन्होंने 2,000 एनवीडिया एच800 जीपीयू का उपयोग किया था – एक कम उन्नत चिप जिसे मूल रूप से अमेरिकी निर्यात नियंत्रणों का अनुपालन करने के लिए डिज़ाइन किया गया था – और आर1 के आधारभूत मॉडल, वी3 को प्रशिक्षित करने के लिए 5.6 मिलियन डॉलर खर्च किए। ओपनएआई के सीईओ सैम ऑल्टमैन ने कहा है कि इसके चैटबॉट जीपीटी-4 को प्रशिक्षित करने में 100 मिलियन डॉलर से अधिक की लागत आई, जबकि विश्लेषकों ने अनुमान लगाया है कि मॉडल में 25,000 से अधिक उन्नत एच100 जीपीयू का उपयोग किया गया था।

सीरियल उद्यमी लियांग वेनफेंग द्वारा 2023 के अंत में स्थापित डीपसीक की घोषणा ने व्यापक रूप से प्रचलित धारणा को उलट दिया कि एआई के क्षेत्र में सबसे आगे रहने की चाह रखने वाली कंपनियों को डेटा सेंटर और बड़ी मात्रा में महंगे हाई-एंड चिप्स में अरबों डॉलर का निवेश करने की आवश्यकता है।

इसने सबसे उन्नत चिप्स के निर्यात पर प्रतिबंध लगाकर चीन के एआई क्षेत्र को बाधित करने के वाशिंगटन के प्रयासों की प्रभावशीलता पर भी सवाल उठाए।

कैलिफ़ोर्निया स्थित एनवीडिया के शेयर, जो जेनरेटिव एआई को शक्ति देने वाले जीपीयू की आपूर्ति पर लगभग एकाधिकार रखते हैं, सोमवार को 17 प्रतिशत गिर गए, जिससे चिप दिग्गज के बाजार मूल्य से लगभग $593 बिलियन का सफाया हो गया – यह आंकड़ा स्वीडन के सकल घरेलू उत्पाद (जीडीपी) के बराबर है।

जबकि इस बात पर व्यापक सहमति है कि डीपसीक द्वारा आर1 की रिलीज़ कम से कम एक महत्वपूर्ण उपलब्धि का प्रतिनिधित्व करती है, कुछ प्रमुख पर्यवेक्षकों ने इसके दावों को सच मानने के खिलाफ चेतावनी दी है।

वर्चुअल रियलिटी कंपनी ओकुलस वीआर के संस्थापक पामर लुकी ने बुधवार को डीपसीक के दावे वाले बजट को “फर्जी” करार दिया और कई “उपयोगी बेवकूफों” पर “चीनी प्रचार” के झांसे में आने का आरोप लगाया।

लकी ने एक्स पर एक पोस्ट में कहा, “यह एक चीनी हेज फंड द्वारा अमेरिकी एआई स्टार्टअप में निवेश को धीमा करने, एनवीडिया जैसे अमेरिकी दिग्गजों के खिलाफ अपने स्वयं के शॉर्ट्स की सेवा करने और प्रतिबंध चोरी को छिपाने के लिए किया गया है।”

“अमेरिका इस तरह के मनोवैज्ञानिक हमलों के लिए एक उपजाऊ बिस्तर है क्योंकि हमारा मीडिया तंत्र हमारी प्रौद्योगिकी कंपनियों से नफरत करता है और राष्ट्रपति ट्रम्प को विफल होते देखना चाहता है।”

पिछले हफ्ते सीएनबीसी के साथ एक साक्षात्कार में, स्केल एआई के सीईओ एलेक्जेंडर वांग ने भी डीपसीक के खाते पर संदेह जताते हुए कहा कि यह उनकी “समझ” थी कि इसके पास 50,000 से अधिक उन्नत एच100 चिप्स तक पहुंच थी, जिसके बारे में वह अमेरिकी निर्यात नियंत्रण के कारण बात नहीं कर सकते थे।

वांग ने अपने दावे के लिए सबूत नहीं दिए। अमेरिकी राष्ट्रपति डोनाल्ड ट्रंप के सबसे करीबी विश्वासपात्रों में से एक, टेक अरबपति एलन मस्क ने डीपसीक के संदेहियों का समर्थन करते हुए वांग के दावे के बारे में एक पोस्ट के तहत एक्स पर “स्पष्ट रूप से” लिखा।

डीपसीक ने टिप्पणी के अनुरोधों का जवाब नहीं दिया।

लेकिन डीपसीक के पहले मॉडल पर काम करने वाले पीएचडी उम्मीदवार जिहान वांग ने स्टार्टअप के आलोचकों पर पलटवार करते हुए कहा, “बात करना सस्ता है।”

“आलोचना करना आसान है,” वांग ने एक्स पर अल जज़ीरा के सवालों के जवाब में कहा कि डीपसीक के दावों को अंकित मूल्य पर नहीं लिया जाना चाहिए।

“अगर वे कोड पर काम करने में अधिक समय लगाते और डीपसीक के विचार को खुद ही दोहराते तो यह कागज पर बात करने से बेहतर होता,” वांग ने बेकार की बातें करने वाले लोगों के बारे में एक चीनी मुहावरे का अंग्रेजी अनुवाद करते हुए कहा।

उन्होंने इस सवाल का सीधा जवाब नहीं दिया कि क्या उन्हें लगता है कि डीपसीक ने आर1 के आधारभूत मॉडल को प्रशिक्षित करने के लिए $6 मिलियन से कम खर्च किया है और कम उन्नत चिप्स का उपयोग किया है।

चीनी मीडिया आउटलेट वेव्स के साथ 2023 के एक साक्षात्कार में, लियांग ने कहा कि उनकी कंपनी ने तत्कालीन अमेरिकी राष्ट्रपति जो बिडेन के प्रशासन द्वारा उनके निर्यात पर प्रतिबंध लगाने से पहले Nvidia के A100 चिप्स के 10,000 स्टॉक किए थे – जो H800 से पुराने हैं।

R1 के उपयोगकर्ता चीन में इसकी उत्पत्ति के कारण इसके सामने आने वाली सीमाओं की ओर भी इशारा करते हैं, अर्थात् बीजिंग द्वारा संवेदनशील माने जाने वाले विषयों पर सेंसरशिप, जिसमें 1989 में तियानमेन स्क्वायर में नरसंहार और ताइवान की स्थिति शामिल है।

इस बात के संकेत में कि डीपसीक के अमेरिकी तकनीकी क्षेत्र पर संभावित प्रभाव के बारे में शुरुआती घबराहट कम होने लगी है, मंगलवार को Nvidia के शेयर की कीमत में लगभग 9 प्रतिशत की वृद्धि हुई।

तकनीक-भारी नैस्डैक 100 पिछले दिन 3 प्रतिशत से अधिक गिरने के बाद 1.59 प्रतिशत बढ़ा।

यूनिवर्सिटी ऑफ क्वींसलैंड में AI में विशेषज्ञता रखने वाले प्रोफेसर टिम मिलर ने कहा कि यह कहना मुश्किल है कि डीपसीक के दावों पर कितना भरोसा किया जाना चाहिए।

मिलर ने अल जज़ीरा को बताया, “मॉडल खुद ही कुछ विवरण देता है कि यह कैसे काम करता है, लेकिन वे जिन मुख्य परिवर्तनों का दावा करते हैं, उनकी लागत – जो मैं समझता हूँ – मॉडल में इतनी अधिक नहीं दिखती है।” मिलर ने कहा कि उन्होंने कोई “खतरे की घंटी” नहीं देखी है, लेकिन शोध पत्र पर भरोसा करने के पक्ष और विपक्ष में उचित तर्क हैं। मिलर ने कहा, “यह सफलता अविश्वसनीय है – लगभग ‘सच होने के लिए बहुत अच्छा’ शैली। लागतों का विभाजन स्पष्ट नहीं है।” दूसरी ओर, उन्होंने कहा, कंप्यूटर विज्ञान में कभी-कभी सफलताएँ मिलती हैं। मिलर ने कहा, “ये बड़े पैमाने के मॉडल बहुत हाल की घटना हैं, इसलिए दक्षताएँ मिलना तय है।” “चूँकि वे जानते थे कि इसे दूसरों के लिए पुनरुत्पादित करना काफी सरल होगा, इसलिए उन्हें पता होगा कि अगर वे सभी को बेवकूफ़ बनाएँगे तो वे बेवकूफ़ लगेंगे। काम को पुनरुत्पादित करने की कोशिश करने के लिए पहले से ही एक टीम प्रतिबद्ध है।” लागत में गिरावट गैर-लाभकारी संस्था CivAI के सह-संस्थापक लुकास हैनसेन ने कहा कि हालांकि यह जानना मुश्किल था कि डीपसीक ने अमेरिकी निर्यात नियंत्रणों को दरकिनार किया या नहीं, स्टार्टअप के दावा किए गए प्रशिक्षण बजट में V3 का उल्लेख था, जो कि OpenAI के GPT-4 के बराबर है, न कि R1 के बराबर।

“GPT-4 ने 2022 के अंत में प्रशिक्षण पूरा कर लिया। 2022 के बाद से बहुत सारे एल्गोरिदम और हार्डवेयर सुधार हुए हैं, जिससे GPT-4 क्लास मॉडल को प्रशिक्षित करने की लागत कम हो गई है। GPT-2 के लिए भी ऐसी ही स्थिति हुई। उस समय इसे प्रशिक्षित करना एक गंभीर उपक्रम था, लेकिन अब आप इसे 90 मिनट में $20 में प्रशिक्षित कर सकते हैं,” हैनसेन ने अल जज़ीरा को बताया। “डीपसीक ने एक बेस मॉडल – इस मामले में, V3 – लेकर और उस बेस मॉडल को अधिक सावधानी से सोचना सिखाने के लिए कुछ चतुर तरीकों को लागू करके R1 बनाया,” हैनसेन ने कहा। “बेस मॉडल को प्रशिक्षित करने की कीमत की तुलना में यह शिक्षण प्रक्रिया तुलनात्मक रूप से सस्ती है। अब जबकि डीपसीक ने आधार मॉडल को चिंतन मॉडल में बदलने के बारे में विवरण प्रकाशित कर दिया है, तो हम बड़ी संख्या में नए चिंतन मॉडल देखेंगे।”

Latest news
Related news