Ev Haberler Deepseek AI geliştirme maliyeti 1,6 milyar dolar, karşılanabilirlik mitini ortadan kaldırarak

Deepseek AI geliştirme maliyeti 1,6 milyar dolar, karşılanabilirlik mitini ortadan kaldırarak

Yazar : Lucas Mar 27,2025

Deepseek'ten yeni sohbet botu, AI pazarında önemli bir etki yarattı ve kendisini ilgi çekici bir açıklama yaptı:

Merhaba, yaratıldım, böylece herhangi bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz.

Bu AI modeli sadece müthiş bir rakip olmakla kalmadı, aynı zamanda Nvidia'nın en büyük hisse senedi fiyat düşüşlerinden birine katkıda bulundu.

Deepseek Testi Resim: ensigame.com

Deepseek'in modelini ayırt eden şey, yenilikçi mimarisi ve eğitim yöntemleridir:

Çoklu Tahmini Tahmin (MTP): Bu teknik, bir cümlenin farklı bölümlerini analiz ederek hem doğruluğu hem de verimliliği önemli ölçüde artırarak modelin aynı anda birden fazla kelimeyi tahmin etmesini sağlar.

Uzmanların Karışımı (MOE): Her bir jeton işleme görevi için sekiz etkinleştirilmiş 256 sinir ağı kullanarak, bu mimari AI eğitimini hızlandırır ve performansı artırır.

Çok Baş Gizli Dikkat (MLA): Bir cümlenin en önemli kısımlarına odaklanarak ve önemli ayrıntıları tekrar tekrar çıkararak MLA, AI'nın önemli nüansları yakalamasını sağlayarak önemli bilgileri kaçırma şansını azaltır.

Önemli bir Çin girişim olan Deepseek, minimum maliyetle rekabetçi bir AI modeli geliştirdiğini iddia ediyor ve sadece 2048 grafik işlemcileri kullanarak Deepseek V3'ü eğitmek için sadece 6 milyon dolar harcadıklarını belirtiyor.

Deepseek V3 Resim: ensigame.com

Bununla birlikte, yarı analizden gelen analistler, Deepseek'in 10.000 H800 birim, 10.000 H100 ve ek H20 GPU dahil olmak üzere yaklaşık 50.000 NVIDIA hopper GPU'si içeren geniş bir hesaplama altyapısı işlettiğini ortaya koydu. Bu kaynaklar birden fazla veri merkezine yayılmıştır ve AI eğitimi, araştırma ve finansal modelleme için kullanılmaktadır.

Şirketin sunuculara toplam yatırımı yaklaşık 1,6 milyar $ 'dır ve operasyonel giderlerin 944 milyon $ olduğu tahmin edilmektedir.

Deepseek, 2023'te ayrı bir AI odaklı bölünme olarak kurulan Çin Hedge Fonu High-Flyer'in bir yan kuruluşudur. Bulut sağlayıcılarına dayanan çoğu girişimin aksine, Deepseek veri merkezlerinin sahibidir ve AI model optimizasyonu ve daha hızlı inovasyon uygulaması üzerinde tam kontrol sağlar. Şirket, esnekliğini ve karar verme hızını artırarak kendi kendini finanse ediyor.

Deepseek Resim: ensigame.com

Dahası, Deepseek'teki bazı araştırmacılar yılda 1.3 milyon doların üzerinde para kazanıyor ve önde gelen Çin üniversitelerinden en iyi yetenekleri çekiyor (şirket yabancı uzmanları işe almıyor).

Bu yatırımlara rağmen, Deepseek'in son modelini sadece 6 milyon dolarlık eğitme iddiası gerçekçi görünmüyor. Bu rakam yalnızca eğitim öncesi sırasında GPU kullanımını açıklar ve araştırma giderlerini, model arıtımını, veri işleme ve genel altyapı maliyetlerini hariç tutar.

Deepseek, kuruluşundan bu yana AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Kompakt yapısı, daha büyük, daha bürokratik şirketlerin aksine AI yeniliklerinin aktif ve etkili bir şekilde uygulanmasına izin verir.

Deepseek Resim: ensigame.com

Deepseek'in örneği, iyi finanse edilen bağımsız bir AI şirketinin endüstri liderleriyle rekabet edebileceğini göstermektedir. Bununla birlikte, uzmanlar, şirketin başarısının büyük ölçüde AI modeli geliştirme için "devrimci bir bütçe" yerine önemli yatırımlar, teknik atılımlar ve güçlü bir ekipten kaynaklandığını belirtiyor.

Yine de, Deepseek'in maliyetleri rakiplerinden daha düşüktür. Örneğin, Deepseek R1'e 5 milyon dolar harcarken, ChatGpt4o'nun eğitilmesi 100 milyon dolara mal oldu.