Der neue Chatbot von Deepseek hat einen signifikanten Einfluss auf den KI -Markt erzielt und sich mit der faszinierenden Aussage vorgestellt:
Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte.
Dieses KI -Modell ist nicht nur ein beeindruckender Konkurrent geworden, sondern auch zu einem der größten Aktienkurs von NVIDIA beigetragen.
Bild: Ensigame.com
Was das Modell von Deepseek unterscheidet, sind seine innovativen Architektur- und Trainingsmethoden, einschließlich:
Multi-Token Prediction (MTP): Mit dieser Technik kann das Modell mehrere Wörter gleichzeitig vorhergesagt, indem verschiedene Teile eines Satzes analysiert werden, wodurch sowohl die Genauigkeit als auch die Effizienz signifikant verbessert wird.
Mischung von Experten (MOE): Nutzung von 256 neuronalen Netzwerken, wobei acht für jede Token -Verarbeitungsaufgabe aktiviert ist, beschleunigt diese Architektur das KI -Training und verbessert die Leistung.
Multi-Head Latent Achtung (MLA): Indem MLA sich auf die wichtigsten Teile eines Satzes konzentriert und wichtige Details extrahiert, verringert sie die Wahrscheinlichkeit, wichtige Informationen zu fehlen, sodass die KI wichtige Nuancen erfassen kann.
Deepseek, ein prominentes chinesisches Startup, behauptet, ein wettbewerbsfähiges KI -Modell zu minimalen Kosten entwickelt zu haben, und erklärte, sie hätten nur 6 Millionen US -Dollar für die Schulung von Deepseek V3 mit nur 2048 Grafikprozessoren ausgegeben.
Bild: Ensigame.com
Analysten aus der semianalyse haben jedoch gezeigt, dass Deepseek eine riesige Computerinfrastruktur betreibt, die rund 50.000 NVIDIA Hopper -GPUs umfasst, darunter 10.000 H800 -Einheiten, 10.000 H100 und zusätzliche H20 -GPUs. Diese Ressourcen werden über mehrere Rechenzentren verbreitet und für KI -Schulungen, Forschung und Finanzmodellierung verwendet.
Die Gesamtinvestition des Unternehmens in Server beträgt ungefähr 1,6 Milliarden US -Dollar, wobei die operativen Ausgaben auf 944 Mio. USD geschätzt werden.
Deepseek ist eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, das das Start-up im Jahr 2023 als separate KI-fokussierte Division festgelegt hat. Im Gegensatz zu den meisten Startups, die sich auf Cloud-Anbieter verlassen, besitzt Deepseek seine Rechenzentren und ermöglicht die vollständige Kontrolle über AI-Modelloptimierung und eine schnellere Implementierung der Innovation. Das Unternehmen bleibt selbst finanziert und verbessert seine Flexibilität und Entscheidungsgeschwindigkeit.
Bild: Ensigame.com
Darüber hinaus verdienen einige Forscher von Deepseek jährlich über 1,3 Millionen US -Dollar und ziehen Top -Talente von führenden chinesischen Universitäten an (das Unternehmen stellt keine ausländischen Spezialisten ein).
Trotz dieser Investitionen scheint Deepseeks Behauptung, sein jüngstes Modell für nur 6 Millionen US -Dollar auszubilden, unrealistisch. Diese Abbildung macht nur die GPU-Nutzung während der Vorausbildung aus und schließt Forschungskosten, Modellverfeinerung, Datenverarbeitung und Gesamtkosten der gesamten Infrastruktur aus.
Seit seiner Gründung hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert. Die kompakte Struktur ermöglicht eine aktive und effektive Implementierung von KI -Innovationen, im Gegensatz zu größeren, bürokratischeren Unternehmen.
Bild: Ensigame.com
Das Beispiel von Deepseek zeigt, dass ein gut finanziertes unabhängiges KI-Unternehmen mit Branchenführern konkurrieren kann. Experten stellen jedoch fest, dass der Erfolg des Unternehmens weitgehend auf erhebliche Investitionen, technische Durchbrüche und ein starkes Team und nicht auf ein "revolutionäres Budget" für die Entwicklung der KI -Modellentwicklung zurückzuführen ist.
Trotzdem bleiben Deepseeks Kosten niedriger als die seiner Konkurrenten. Zum Beispiel gab Deepseek 5 Millionen US -Dollar für R1 aus, während Chatgpt4O 100 Millionen US -Dollar kostete.