ডিপসেকের নতুন চ্যাটবট এআই বাজারে গুরুত্বপূর্ণ প্রভাব ফেলেছে, উদ্বেগজনক বিবৃতি দিয়ে নিজেকে পরিচয় করিয়ে দেয়:
হাই, আমাকে তৈরি করা হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে।
এই এআই মডেলটি কেবল একটি দুর্দান্ত প্রতিযোগী হয়ে উঠেছে না তবে এনভিডিয়ার বৃহত্তম শেয়ারের দামের ড্রপগুলির মধ্যে একটিতে অবদান রেখেছিল।
চিত্র: ensigame.com
ডিপসিকের মডেলটিকে যা আলাদা করে তা হ'ল এর উদ্ভাবনী স্থাপত্য এবং প্রশিক্ষণের পদ্ধতি, যার মধ্যে রয়েছে:
মাল্টি-টোকেন পূর্বাভাস (এমটিপি): এই কৌশলটি একটি বাক্যটির বিভিন্ন অংশ বিশ্লেষণ করে মডেলটিকে একবারে একাধিক শব্দের পূর্বাভাস দেওয়ার অনুমতি দেয়, যথার্থতা এবং দক্ষতা উভয়ই উল্লেখযোগ্যভাবে উন্নত করে।
বিশেষজ্ঞদের মিশ্রণ (এমওই): প্রতিটি টোকেন প্রসেসিং টাস্কের জন্য আটটি সক্রিয় করে 256 নিউরাল নেটওয়ার্কগুলি ব্যবহার করে, এই আর্কিটেকচারটি এআই প্রশিক্ষণকে গতি বাড়িয়ে তোলে এবং কর্মক্ষমতা বাড়ায়।
মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): একটি বাক্যটির সর্বাধিক উল্লেখযোগ্য অংশগুলিতে মনোনিবেশ করে এবং বারবার মূল বিবরণগুলি বের করে, এমএলএ গুরুত্বপূর্ণ তথ্যগুলি হারিয়ে যাওয়ার সুযোগকে হ্রাস করে, এআইকে গুরুত্বপূর্ণ সূক্ষ্মতাগুলি ক্যাপচার করতে সক্ষম করে।
বিশিষ্ট চীনা স্টার্টআপ ডিপসেক দাবি করেছেন যে তারা ন্যূনতম ব্যয়ে প্রতিযোগিতামূলক এআই মডেল তৈরি করেছে, তারা উল্লেখ করেছে যে তারা মাত্র 2048 গ্রাফিক্স প্রসেসর ব্যবহার করে ডিপসেক ভি 3 প্রশিক্ষণে মাত্র million মিলিয়ন ডলার ব্যয় করেছে।
চিত্র: ensigame.com
তবে, সেমিয়ানালাইসিসের বিশ্লেষকরা প্রকাশ করেছেন যে ডিপসেক প্রায় 50,000 এনভিডিয়া হপার জিপিইউগুলির সমন্বয়ে 10,000 এইচ 800 ইউনিট, 10,000 এইচ 100 এস এবং অতিরিক্ত এইচ 20 জিপিইউ সহ একটি বিশাল গণ্য অবকাঠামো পরিচালনা করে। এই সংস্থানগুলি একাধিক ডেটা সেন্টারে ছড়িয়ে পড়ে এবং এআই প্রশিক্ষণ, গবেষণা এবং আর্থিক মডেলিংয়ের জন্য ব্যবহৃত হয়।
সার্ভারগুলিতে কোম্পানির মোট বিনিয়োগ প্রায় 1.6 বিলিয়ন ডলার, অপারেশনাল ব্যয়ের সাথে আনুমানিক $ 944 মিলিয়ন ডলার।
ডিপসেক হ'ল চীনা হেজ ফান্ড হাই-ফ্লায়ারের একটি সহায়ক সংস্থা, যা ২০২৩ সালে পৃথক এআই-কেন্দ্রিক বিভাগ হিসাবে স্টার্টআপটি প্রতিষ্ঠা করেছিল। ক্লাউড সরবরাহকারীদের উপর নির্ভর করে এমন বেশিরভাগ স্টার্টআপগুলির বিপরীতে ডিপসেক তার ডেটা সেন্টারগুলির মালিক, এআই মডেল অপ্টিমাইজেশন এবং দ্রুত উদ্ভাবনের বাস্তবায়নের উপর সম্পূর্ণ নিয়ন্ত্রণের অনুমতি দেয়। সংস্থাটি স্ব-অর্থায়িত থাকে, এর নমনীয়তা এবং সিদ্ধান্ত গ্রহণের গতি বাড়িয়ে তোলে।
চিত্র: ensigame.com
তদুপরি, ডিপসেকের কিছু গবেষক বার্ষিক $ 1.3 মিলিয়ন ডলারের বেশি আয় করেন, শীর্ষস্থানীয় চীনা বিশ্ববিদ্যালয়গুলি থেকে শীর্ষ প্রতিভা আকৃষ্ট করে (সংস্থাটি বিদেশী বিশেষজ্ঞদের নিয়োগ দেয় না)।
এই বিনিয়োগগুলি সত্ত্বেও, ডিপসিকের সর্বশেষ মডেলটিকে মাত্র million মিলিয়ন ডলারে প্রশিক্ষণের দাবি অবাস্তব বলে মনে হয়। এই চিত্রটি কেবল প্রাক-প্রশিক্ষণের সময় জিপিইউ ব্যবহারের জন্য অ্যাকাউন্ট করে এবং গবেষণা ব্যয়, মডেল পরিশোধন, ডেটা প্রসেসিং এবং সামগ্রিক অবকাঠামোগত ব্যয় বাদ দেয়।
প্রতিষ্ঠার পর থেকে ডিপসেক এআই বিকাশে $ 500 মিলিয়ন ডলারের বেশি বিনিয়োগ করেছে। এর কমপ্যাক্ট কাঠামোটি বৃহত্তর, আরও আমলাতান্ত্রিক সংস্থার বিপরীতে এআই উদ্ভাবনের সক্রিয় এবং কার্যকর বাস্তবায়নের অনুমতি দেয়।
চিত্র: ensigame.com
ডিপসেকের উদাহরণ দেখায় যে একটি ভাল অর্থায়িত স্বতন্ত্র এআই সংস্থা শিল্প নেতাদের সাথে প্রতিযোগিতা করতে পারে। তবে বিশেষজ্ঞরা নোট করেছেন যে এআই মডেল বিকাশের জন্য "বিপ্লবী বাজেট" না করে উল্লেখযোগ্য বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দলের কারণে কোম্পানির সাফল্য মূলত।
তবুও, ডিপসিকের ব্যয় তার প্রতিযোগীদের তুলনায় কম থাকে। উদাহরণস্বরূপ, ডিপসেক আর 1 এ 5 মিলিয়ন ডলার ব্যয় করেছে, যখন চ্যাটজিপিটি 4 ও প্রশিক্ষণের জন্য $ 100 মিলিয়ন ব্যয় করেছে।