GPT-4o mini
OpenAI · GPT-4o
Multimodales Kostenmodell von OpenAI, im Juli 2024 veröffentlicht. Verarbeitet Text und Bild im API, mit 128K Kontext und bis zu 16K Output-Tokens pro Request. Mit 0,15 USD pro Million Input-Tokens liegt der Preis um Faktor 60 unter GPT-4o, bei vergleichbarer Qualität für einfache Klassifizierung, Zusammenfassung und Chat. Bleibt 2026 das Standard-Kostenmodell, ist aber bei Coding und langen Kontexten von GPT-4.1 mini abgehängt worden.
Über Azure OpenAI mit dokumentierter EU-Datenresidenz nutzbar. OpenAI-Direktzugriff hat seit 2025 EU-Residenz "at rest" für Enterprise-, Edu- und API-Kunden, die Inferenz läuft jedoch weiterhin über US-Infrastruktur.
Stärken
- Sehr günstige Inferenz: 0,15 / 0,60 USD pro Mio. Tokens (in/out)
- Multimodal: Text + Bild als Input bereits im API-Standard
- 128K Kontext deckt die meisten Alltags-Workloads ab
- Verfügbar via Azure OpenAI mit dokumentierter EU-Datenresidenz
Schwächen
- Coding-Benchmarks deutlich unter GPT-4.1 mini bei ähnlichem Preis
- Kein Reasoning-Modus - für Multi-Step-Aufgaben o4-mini wählen
- Kontextfenster halb so groß wie GPT-4.1 mini (128K vs. 1M)
GPT-4o mini ist OpenAIs günstiges Multimodal-Kostenmodell, im Juli 2024 als Nachfolger von GPT-3.5 Turbo gestartet. Im Vergleich zu GPT-4.1 mini (April 2025, $0,40 / $1,60) ist GPT-4o mini bei reinen Input-Kosten zwar billiger, aber GPT-4.1 mini hat das achtfache Kontextfenster (1M vs. 128K) und stärkere Coding-Scores. Für reine Klassifikation oder simple Chat-Bots bleibt GPT-4o mini sinnvoll; für alles mit langen Eingaben oder Code ist GPT-4.1 mini der bessere Standard.