दीपसेक के नए चैटबॉट ने एआई बाजार में एक महत्वपूर्ण प्रभाव डाला है, जो खुद को पेचीदा बयान के साथ पेश करता है:
नमस्ते, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है।
यह AI मॉडल न केवल एक दुर्जेय प्रतियोगी बन गया है, बल्कि NVIDIA के सबसे बड़े स्टॉक प्राइस ड्रॉप्स में से एक में भी योगदान दिया है।
चित्र: ensigame.com
डीपसेक के मॉडल को अलग करने के लिए इसकी अभिनव वास्तुकला और प्रशिक्षण के तरीके हैं, जिसमें शामिल हैं:
मल्टी-टोकन भविष्यवाणी (एमटीपी): यह तकनीक मॉडल को एक वाक्य के विभिन्न हिस्सों का विश्लेषण करके एक बार में कई शब्दों की भविष्यवाणी करने की अनुमति देती है, सटीकता और दक्षता दोनों में काफी सुधार करती है।
विशेषज्ञों का मिश्रण (एमओई): 256 तंत्रिका नेटवर्क का उपयोग करना, प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होने के साथ, यह आर्किटेक्चर एआई प्रशिक्षण को गति देता है और प्रदर्शन को बढ़ाता है।
मल्टी-हेड लेटेंट ध्यान (एमएलए): एक वाक्य के सबसे महत्वपूर्ण हिस्सों पर ध्यान केंद्रित करके और प्रमुख विवरणों को बार-बार निकालने से, एमएलए महत्वपूर्ण जानकारी को लापता होने की संभावना को कम करता है, एआई को महत्वपूर्ण बारीकियों को पकड़ने में सक्षम बनाता है।
दीपसेक, एक प्रमुख चीनी स्टार्टअप, एक न्यूनतम लागत पर एक प्रतिस्पर्धी एआई मॉडल विकसित करने का दावा करता है, जिसमें कहा गया है कि उन्होंने केवल 2048 ग्राफिक्स प्रोसेसर का उपयोग करके दीपसेक वी 3 को प्रशिक्षित करने पर केवल $ 6 मिलियन खर्च किए हैं।
चित्र: ensigame.com
हालांकि, सेमियनलिसिस के विश्लेषकों ने खुलासा किया है कि डीपसेक एक विशाल कम्प्यूटेशनल बुनियादी ढांचे का संचालन करता है, जिसमें लगभग 50,000 एनवीडिया हॉपर जीपीयू शामिल हैं, जिसमें 10,000 एच 800 यूनिट, 10,000 एच 100 और अतिरिक्त एच 20 जीपीयू शामिल हैं। ये संसाधन कई डेटा केंद्रों में फैले हुए हैं और एआई प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग के लिए उपयोग किए जाते हैं।
सर्वर में कंपनी का कुल निवेश लगभग 1.6 बिलियन डॉलर है, जिसमें परिचालन खर्च $ 944 मिलियन है।
दीपसेक चीनी हेज फंड हाई-फ्लायर की एक सहायक कंपनी है, जिसने 2023 में एक अलग एआई-केंद्रित डिवीजन के रूप में स्टार्टअप की स्थापना की। क्लाउड प्रदाताओं पर भरोसा करने वाले अधिकांश स्टार्टअप्स के विपरीत, डीपसेक अपने डेटा केंद्रों का मालिक है, एआई मॉडल अनुकूलन और तेजी से नवाचार कार्यान्वयन पर पूर्ण नियंत्रण की अनुमति देता है। कंपनी स्व-वित्त पोषित है, अपनी लचीलापन और निर्णय लेने की गति को बढ़ाती है।
चित्र: ensigame.com
इसके अलावा, दीपसेक के कुछ शोधकर्ता सालाना $ 1.3 मिलियन से अधिक कमाते हैं, प्रमुख चीनी विश्वविद्यालयों से शीर्ष प्रतिभा को आकर्षित करते हैं (कंपनी विदेशी विशेषज्ञों को काम पर नहीं रखती है)।
इन निवेशों के बावजूद, डीपसेक ने अपने नवीनतम मॉडल को केवल $ 6 मिलियन के प्रशिक्षण के लिए प्रशिक्षण देने का दावा अवास्तविक लगता है। यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान जीपीयू उपयोग के लिए खाता है और अनुसंधान व्यय, मॉडल शोधन, डेटा प्रसंस्करण और समग्र बुनियादी ढांचे की लागत को बाहर करता है।
अपनी स्थापना के बाद से, दीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। इसकी कॉम्पैक्ट संरचना बड़ी, अधिक नौकरशाही कंपनियों के विपरीत, एआई नवाचारों के सक्रिय और प्रभावी कार्यान्वयन के लिए अनुमति देती है।
चित्र: ensigame.com
दीपसेक के उदाहरण से पता चलता है कि एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी उद्योग के नेताओं के साथ प्रतिस्पर्धा कर सकती है। हालांकि, विशेषज्ञ ध्यान देते हैं कि कंपनी की सफलता काफी हद तक एआई मॉडल के विकास के लिए "क्रांतिकारी बजट" के बजाय महत्वपूर्ण निवेश, तकनीकी सफलताओं और एक मजबूत टीम के कारण है।
फिर भी, डीपसेक की लागत उसके प्रतिद्वंद्वियों की तुलना में कम है। उदाहरण के लिए, दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, जबकि CHATGPT4O को प्रशिक्षित करने के लिए $ 100 मिलियन का खर्च आया।