Claude Sonnet 4
Anthropic · Claude 4
Mittleres Modell der Claude-4-Familie, am 22. Mai 2025 gestartet. Im August 2025 brachte Anthropic mit Sonnet 4 das erste 1-Million-Token-Kontextfenster in die Claude-Produktion. Preislich liegt Sonnet 4 bei 3 / 15 USD pro Million Tokens und damit deutlich unter Opus. Starke Wahl für Produktivcode, Agent-Schleifen und lange Dokument-Analysen, ohne den Opus-Aufpreis. Ersetzt bei den meisten Workloads das frühere Claude 3.5 Sonnet ohne spürbaren Qualitätsverlust.
EU-Inferenz möglich über AWS Bedrock (Frankfurt) und Google Vertex AI (zehn EU-Regionen). Anthropic-Direkt-API läuft primär US-basiert; DPA mit Enterprise-Kunden ist Standard.
Stärken
- 1M-Token-Kontext zum Standardpreis, keine Long-Context-Surcharge mehr
- Preis-Leistungs-Sweet-Spot in der Claude-4-Familie
- Starke SWE-bench- und Coding-Scores nahe an Opus
- Prompt-Caching + Batch-API senken Kosten auf Produktions-Niveau
Schwächen
- Kein natives Bild-Output (wie die gesamte Claude-Familie)
- Gegenüber Opus 4.7 spürbar schwächer auf ARC-AGI und Competition-Mathe
- Reasoning-Tiefe hinter o3 und Opus bei Multi-Step-Wissenschaftsproblemen
Sonnet 4 ist 2025/26 der Mittelklasse-Standard der Claude-Familie. Gegenüber Opus 4.7 (5 / 25 USD) ist Sonnet 4 um Faktor ~1,7 günstiger bei 1M Kontext, verliert aber auf Reasoning-Benchmarks. Im Vergleich zu GPT-4.1 mini (0,40 / 1,60) ist Sonnet teurer, aber in Produktions- Code und strukturierten Outputs klar überlegen. Für viele Teams ist Sonnet 4 das Default-Modell, auf das Opus nur bei speziellen Tasks hochgeschaltet wird.