o3

OpenAI · o-series

Zuletzt geprüft 23. April 2026

OpenAIs Reasoning-Flagship der o-Serie, am 16. April 2025 allgemein verfügbar geworden. Nutzt interne "Thinking-Tokens" und chain-of- thought-Reasoning, um komplexe Aufgaben in Code, Mathematik, Wissen- schaft und visueller Analyse zu lösen. Im Juni 2025 hat OpenAI die API-Preise um 80 % gesenkt, damit liegt o3 jetzt bei 2 / 8 USD pro Million Tokens - mit Cached-Input-Rabatt auf 0,50 USD. Für produktive Reasoning-Workloads und Agent-Schleifen, bei denen Tiefe wichtiger ist als Geschwindigkeit.

Über Azure OpenAI mit EU-Datenresidenz; OpenAI-Direkt-API bietet seit 2025 EU-Residenz "at rest" für Enterprise/Edu/API-Kunden. Inferenz läuft über US-Rechenzentren.

Stärken

  • 200K-Token-Kontext mit bis zu 100K Output-Tokens
  • Branchenführendes Reasoning auf ARC-AGI, GPQA, Competition-Coding
  • Aggressiver Cached-Input-Preis (0,50 USD) senkt Agenten-Kosten
  • Starke multimodale Verarbeitung von Bildern, Charts, Diagrammen

Schwächen

  • Reasoning-Modus verbrennt unsichtbar Tokens - reale Kosten höher
  • Langsamer als GPT-4.1 - nicht für interaktive Low-Latency-Chats
  • Knowledge-Cutoff Juni 2024, aktuelle Daten müssen per Tool kommen

o3 ist OpenAIs Antwort auf Claude Opus und Gemini 3 Pro im Reasoning- Segment. Gegenüber dem älteren o1 ist der Preis durch den 80-%-Cut im Juni 2025 drastisch gefallen, o3 ist heute fast so günstig wie GPT-4.1 - aber mit der Reasoning-Schicht. Für Mathematik, Wissen- schaftsanalysen, Multi-Step-Agents und Competition-Coding ist o3 die erste Wahl innerhalb der OpenAI-Familie; im direkten Vergleich mit Claude Opus 4.7 bleibt Claude bei SWE-bench Verified aber vorn.