DeepSeek R1
DeepSeek · DeepSeek R
Reasoning-Modell von DeepSeek, am 20. Januar 2025 veröffentlicht und als erstes chinesisches Open-Weight-Modell mit echter o1-Klasse- Performance bekannt geworden. 671B Parameter im Mixture-of-Experts- Aufbau, davon 37B aktiv pro Token. 64K Kontext, bis 32K Reasoning-Tokens. Preislich bei 0,55 / 2,19 USD pro Million Tokens - rund 27× günstiger als OpenAI o1 zum Release. Verfügbar als gewichts-freies Modell (MIT-Lizenz auf Code, freie Gewichte) und über die DeepSeek-API.
DeepSeek-Cloud-API läuft über chinesische Infrastruktur ohne EU-DPA-Standardvertrag. Für DSGVO-Compliance praktisch nur via Self-Hosting oder über westliche Hoster (Together AI, Fireworks, etc.) sinnvoll, jeweils mit eigenem Vertragsrahmen.
Stärken
- 27× günstiger als OpenAI o1 bei vergleichbarem Reasoning-Profil
- Offen verfügbare Gewichte für Self-Hosting möglich
- Sichtbarer Reasoning-Chain im Output (deepseek-reasoner)
- Cache-Hit-Preis nur 0,14 USD pro Mio. Input-Tokens
Schwächen
- Knappes Kontextfenster (64K) im Vergleich zu o3 (200K) oder Gemini (1M)
- DSGVO-Status problematisch - chinesische Cloud-Infrastruktur
- Einzelne Antworten können bei sensiblen China-Themen zensiert sein
DeepSeek R1 war 2025 der disruptive Moment am Markt: ein chinesisches Reasoning-Modell, das o1 auf Augenhöhe schlug - und das zum 1/27 des Preises. Gegenüber o3 (heute 2 / 8 USD nach Preisschnitt) ist R1 immer noch günstiger im Output-Preis, hat aber ein viel kleineres Kontext- fenster (64K vs. 200K). Für Reasoning-Workloads außerhalb von DSGVO- Pflichten ist R1 die rationale Wahl, sonst nur über Self-Hosting oder westliche Hoster.