首頁新聞 DeepSeek AI開發的費用為16億美元，揭穿了負擔能力神話

DeepSeek AI開發的費用為16億美元，揭穿了負擔能力神話

作者 : Lucas Mar 27,2025

來自DeepSeek的新聊天機器人對AI市場產生了重大影響，並以有趣的聲明介紹了自己：

嗨，我是被創建的，所以您可以問任何問題，並得到一個甚至可能讓您感到驚訝的答案。

這種AI模型不僅成為了強大的競爭對手，而且還為NVIDIA最大的股價下跌之一做出了貢獻。

DeepSeek測試圖片：ensigame.com

DeepSeek模型的區別是其創新的建築和培訓方法，其中包括：

多語預測（MTP）：此技術允許該模型通過分析句子的不同部分立即預測多個單詞，從而顯著提高了準確性和效率。

專家（MOE）的混合物：利用256個神經網絡，每個令牌處理任務都激活了8個，該體系結構加快了AI訓練並增強了性能。

多頭潛在註意力（MLA）：通過重點關注句子的最重要部分並反复提取關鍵細節，MLA減少了缺少關鍵信息的機會，從而使AI能夠捕獲重要的細微差別。

DeepSeek是一家著名的中國初創公司，聲稱自己以最低的成本開發了競爭性的AI模型，並指出他們僅使用2048個圖形處理器花了600萬美元在培訓DeepSeek V3上。

DeepSeek V3 圖片：ensigame.com

但是，半分析的分析師表明，DeepSeek運營著龐大的計算基礎設施，其中包括約50,000個NVIDIA HOPPER GPU，其中包括10,000 H800單位，10,000 H100和其他H20 GPU。這些資源分佈在多個數據中心，並用於AI培訓，研究和財務建模。

該公司對服務器的總投資約為16億美元，運營費用估計為9.44億美元。

DeepSeek是中國對沖基金高飛行員的子公司，該基金在2023年將這家初創公司建立為獨立的AI專注於部門。與大多數依賴雲提供商的初創公司不同，DeepSeek擁有其數據中心，可以完全控制AI模型優化和更快的創新實施。該公司保持自籌資金，提高其靈活性和決策速度。

DeepSeek 圖片：ensigame.com

此外，DeepSeek的一些研究人員每年收入超過130萬美元，吸引了中國領先的大學的頂尖人才（該公司不僱用外國專家）。

儘管進行了這些投資，但DeepSeek對僅600萬美元培訓其最新模式的主張似乎是不現實的。該圖僅說明在預培訓期間使用GPU，並排除了研究費用，改進，數據處理和整體基礎設施成本。

自成立以來，DeepSeek已在AI開發方面投資了超過5億美元。它的緊湊結構允許積極有效地實施AI創新，這與更大，更官僚的公司不同。

DeepSeek 圖片：ensigame.com

DeepSeek的示例表明，資金充足的獨立AI公司可以與行業領導者競爭。但是，專家指出，該公司的成功在很大程度上是由於重大投資，技術突破和強大的團隊，而不是用於AI模型開發的“革命性預算”。

儘管如此，DeepSeek的成本仍低於其競爭對手的成本。例如，DeepSeek在R1上花費了500萬美元，而Chatgpt4o的培訓花費了1億美元。