首頁 新聞 DeepSeek AI開發的費用為16億美元,揭穿了負擔能力神話

DeepSeek AI開發的費用為16億美元,揭穿了負擔能力神話

作者 : Lucas Mar 27,2025

來自DeepSeek的新聊天機器人對AI市場產生了重大影響,並以有趣的聲明介紹了自己:

嗨,我是被創建的,所以您可以問任何問題,並得到一個甚至可能讓您感到驚訝的答案。

這種AI模型不僅成為了強大的競爭對手,而且還為NVIDIA最大的股價下跌之一做出了貢獻。

DeepSeek測試圖片:ensigame.com

DeepSeek模型的區別是其創新的建築和培訓方法,其中包括:

多語預測(MTP):此技術允許該模型通過分析句子的不同部分立即預測多個單詞,從而顯著提高了準確性和效率。

專家(MOE)的混合物:利用256個神經網絡,每個令牌處理任務都激活了8個,該體系結構加快了AI訓練並增強了性能。

多頭潛在註意力(MLA):通過重點關注句子的最重要部分並反复提取關鍵細節,MLA減少了缺少關鍵信息的機會,從而使AI能夠捕獲重要的細微差別。

DeepSeek是一家著名的中國初創公司,聲稱自己以最低的成本開發了競爭性的AI模型,並指出他們僅使用2048個圖形處理器花了600萬美元在培訓DeepSeek V3上。

DeepSeek V3圖片:ensigame.com

但是,半分析的分析師表明,DeepSeek運營著龐大的計算基礎設施,其中包括約50,000個NVIDIA HOPPER GPU,其中包括10,000 H800單位,10,000 H100和其他H20 GPU。這些資源分佈在多個數據中心,並用於AI培訓,研究和財務建模。

該公司對服務器的總投資約為16億美元,運營費用估計為9.44億美元。

DeepSeek是中國對沖基金高飛行員的子公司,該基金在2023年將這家初創公司建立為獨立的AI專注於部門。與大多數依賴雲提供商的初創公司不同,DeepSeek擁有其數據中心,可以完全控制AI模型優化和更快的創新實施。該公司保持自籌資金,提高其靈活性和決策速度。

DeepSeek圖片:ensigame.com

此外,DeepSeek的一些研究人員每年收入超過130萬美元,吸引了中國領先的大學的頂尖人才(該公司不僱用外國專家)。

儘管進行了這些投資,但DeepSeek對僅600萬美元培訓其最新模式的主張似乎是不現實的。該圖僅說明在預培訓期間使用GPU,並排除了研究費用,改進,數據處理和整體基礎設施成本。

自成立以來,DeepSeek已在AI開發方面投資了超過5億美元。它的緊湊結構允許積極有效地實施AI創新,這與更大,更官僚的公司不同。

DeepSeek圖片:ensigame.com

DeepSeek的示例表明,資金充足的獨立AI公司可以與行業領導者競爭。但是,專家指出,該公司的成功在很大程度上是由於重大投資,技術突破和強大的團隊,而不是用於AI模型開發的“革命性預算”。

儘管如此,DeepSeek的成本仍低於其競爭對手的成本。例如,DeepSeek在R1上花費了500萬美元,而Chatgpt4o的培訓花費了1億美元。