DeepSeek V3 0324
DeepSeek · DeepSeek V3
Mixture-of-Experts-Allzweckmodell von DeepSeek, am 24. März 2025 als „minor update" angekündigt - und im Vergleich zu V3 (Dezember 2024) bei Coding, Mathematik und Reasoning deutlich verbessert. 685B Gesamtparameter, 37B aktiv pro Token, 131K Kontext. Preis liegt bei rund 0,27 / 1,10 USD pro Million Tokens (DeepSeek-API), über OpenRouter teils noch günstiger. Bleibt das stärkste offene Allzweck-Chat-Modell Anfang 2026, vor Llama 4 und Qwen 3.
Wie DeepSeek R1: DeepSeek-Cloud läuft über China-Infrastruktur ohne Standard-EU-DPA. Über westliche Hoster (Together AI, Fireworks) oder Self-Hosting bleibt das Modell für EU-Workloads nutzbar.
Stärken
- Top-Open-Weight-Allzweckmodell mit 131K Kontext
- MoE-Architektur - kostengünstige Inferenz (37B aktiv von 685B)
- Stark verbessert auf Coding und Mathematik gegenüber V3 (Dez 2024)
- Offene Gewichte erlauben Self-Hosting auf eigenen GPUs
Schwächen
- Cloud-API über chinesische Infrastruktur - DSGVO-problematisch
- Kein dediziertes Reasoning wie R1 - Multi-Step-Logik schwächer
- Inferenz-VRAM-Bedarf hoch (685B Total) ohne MoE-Optimierung
V3 0324 ist DeepSeeks Allzweck-Antwort auf GPT-4.1 und Claude Sonnet zum Open-Weight-Preis. Im direkten Vergleich mit Llama 4 Scout (auch MoE, 109B / 17B aktiv, 10M Kontext) bietet V3 0324 stärkere Reasoning- Scores, aber ein viel kleineres Kontextfenster. Für reines Allzweck- Chat ohne DSGVO-Pflichten ist V3 0324 das beste Open-Weight-Modell - sonst Llama 4 Scout (Meta-Lizenz, westliche Hoster) oder Mistral.