Rumah Berita Pembangunan DeepSeek AI berharga $ 1.6 bilion, membatalkan mitos kemampuan

Pembangunan DeepSeek AI berharga $ 1.6 bilion, membatalkan mitos kemampuan

Pengarang : Lucas Mar 27,2025

Chatbot baru dari DeepSeek telah memberi impak yang signifikan dalam pasaran AI, memperkenalkan dirinya dengan pernyataan yang menarik:

Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda.

Model AI ini bukan sahaja menjadi pesaing yang hebat tetapi juga menyumbang kepada salah satu penurunan harga saham terbesar NVIDIA.

Ujian DeepSeek Imej: ensigame.com

Apa yang membezakan model DeepSeek adalah kaedah seni bina dan latihan yang inovatif, termasuk:

Ramalan Multi-Token (MTP): Teknik ini membolehkan model untuk meramalkan beberapa perkataan sekaligus dengan menganalisis bahagian-bahagian yang berlainan dari satu kalimat, dengan ketara meningkatkan ketepatan dan kecekapan.

Campuran Pakar (MOE): Menggunakan 256 rangkaian saraf, dengan lapan diaktifkan untuk setiap tugas pemprosesan token, seni bina ini mempercepat latihan AI dan meningkatkan prestasi.

Perhatian Laten Multi-Head (MLA): Dengan memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat dan mengekstrak butiran utama berulang kali, MLA mengurangkan peluang kehilangan maklumat penting, membolehkan AI menangkap nuansa penting.

DeepSeek, permulaan Cina yang terkenal, mendakwa telah membangunkan model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya menghabiskan $ 6 juta untuk latihan DeepSeek V3 menggunakan hanya pemproses grafik 2048.

DeepSeek V3 Imej: ensigame.com

Walau bagaimanapun, penganalisis dari semianalisis telah mendedahkan bahawa DeepSeek mengendalikan infrastruktur pengiraan yang luas, yang terdiri daripada sekitar 50,000 GPU NVIDIA Hopper, termasuk 10,000 H800 unit, 10,000 H100s, dan GPU tambahan H20. Sumber -sumber ini tersebar di pelbagai pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.

Jumlah pelaburan syarikat dalam pelayan adalah kira -kira $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.

DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang menubuhkan permulaan sebagai bahagian yang berfokus pada AI pada tahun 2023. Tidak seperti kebanyakan pemula yang bergantung kepada penyedia awan, DeepSeek memiliki pusat datanya, yang membolehkan kawalan penuh ke atas pengoptimuman model AI dan pelaksanaan inovasi yang lebih cepat. Syarikat itu tetap dibiayai sendiri, meningkatkan kelajuan fleksibiliti dan membuat keputusan.

Deepseek Imej: ensigame.com

Lebih -lebih lagi, beberapa penyelidik di DeepSeek memperoleh lebih dari $ 1.3 juta setiap tahun, menarik bakat teratas dari universiti -universiti China yang terkemuka (syarikat itu tidak mengupah pakar asing).

Walaupun pelaburan ini, tuntutan DeepSeek untuk melatih model terbarunya untuk hanya $ 6 juta nampaknya tidak realistik. Angka ini hanya menyumbang penggunaan GPU semasa latihan pra-latihan dan tidak termasuk perbelanjaan penyelidikan, penghalusan model, pemprosesan data, dan kos infrastruktur keseluruhan.

Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Struktur padatnya membolehkan pelaksanaan inovasi AI yang aktif dan berkesan, tidak seperti syarikat birokrasi yang lebih besar dan lebih besar.

Deepseek Imej: ensigame.com

Contoh DeepSeek menunjukkan bahawa syarikat AI bebas yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar -pakar mencatatkan bahawa kejayaan syarikat itu sebahagian besarnya disebabkan oleh pelaburan yang signifikan, kejayaan teknikal, dan pasukan yang kuat, bukannya "bajet revolusioner" untuk pembangunan model AI.

Namun, kos Deepseek kekal lebih rendah daripada pesaingnya. Sebagai contoh, DeepSeek membelanjakan $ 5 juta pada R1, manakala chatgpt4o berharga $ 100 juta untuk melatih.