DeepSeek V3 0324

DeepSeek · DeepSeek V3

Zuletzt geprüft 23. April 2026

Mixture-of-Experts-Allzweckmodell von DeepSeek, am 24. März 2025 als „minor update" angekündigt - und im Vergleich zu V3 (Dezember 2024) bei Coding, Mathematik und Reasoning deutlich verbessert. 685B Gesamt­parameter, 37B aktiv pro Token, 131K Kontext. Preis liegt bei rund 0,27 / 1,10 USD pro Million Tokens (DeepSeek-API), über OpenRouter teils noch günstiger. Bleibt das stärkste offene Allzweck-Chat-Modell Anfang 2026, vor Llama 4 und Qwen 3.

Wie DeepSeek R1: DeepSeek-Cloud läuft über China-Infrastruktur ohne Standard-EU-DPA. Über westliche Hoster (Together AI, Fireworks) oder Self-Hosting bleibt das Modell für EU-Workloads nutzbar.

Stärken

  • Top-Open-Weight-Allzweckmodell mit 131K Kontext
  • MoE-Architektur - kostengünstige Inferenz (37B aktiv von 685B)
  • Stark verbessert auf Coding und Mathematik gegenüber V3 (Dez 2024)
  • Offene Gewichte erlauben Self-Hosting auf eigenen GPUs

Schwächen

  • Cloud-API über chinesische Infrastruktur - DSGVO-problematisch
  • Kein dediziertes Reasoning wie R1 - Multi-Step-Logik schwächer
  • Inferenz-VRAM-Bedarf hoch (685B Total) ohne MoE-Optimierung

V3 0324 ist DeepSeeks Allzweck-Antwort auf GPT-4.1 und Claude Sonnet zum Open-Weight-Preis. Im direkten Vergleich mit Llama 4 Scout (auch MoE, 109B / 17B aktiv, 10M Kontext) bietet V3 0324 stärkere Reasoning- Scores, aber ein viel kleineres Kontextfenster. Für reines Allzweck- Chat ohne DSGVO-Pflichten ist V3 0324 das beste Open-Weight-Modell - sonst Llama 4 Scout (Meta-Lizenz, westliche Hoster) oder Mistral.