GPT-4.1 nano
OpenAI · GPT-4.1
Kleinste und schnellste Variante der GPT-4.1-Familie, ebenfalls am 14. April 2025 gestartet. Trotz kleinster Größe behält GPT-4.1 nano das 1M-Token-Kontextfenster und übertrifft GPT-4o mini auf MMLU (80,1 %) sowie bei Coding (Aider polyglot 9,8 %). Bei 0,10 / 0,40 USD pro Million Tokens ist es das günstigste OpenAI-Modell im API. Positioniert für Autocomplete, Klassifikation und Extraktion aus langen Dokumenten - nicht für Reasoning oder kreatives Schreiben.
Über Azure OpenAI mit EU-Datenresidenz; OpenAI-Direkt-API mit EU-Residenz "at rest" für Enterprise/Edu/API seit 2025, Inferenz US-basiert.
Stärken
- Günstigstes OpenAI-Modell (0,10 / 0,40 USD pro Mio. Tokens)
- 1M-Token-Kontext trotz kleiner Modellgröße
- Niedrigste Latenz in der OpenAI-Palette
- Schlägt GPT-4o mini auf MMLU, GPQA und Aider-Coding
Schwächen
- Deutlich schwächer als GPT-4.1 mini bei komplexen Reasoning-Ketten
- 32K Output-Limit, wie alle 4.1er-Varianten
- Kein Reasoning-Modus, keine tiefen Logik-Ketten möglich
GPT-4.1 nano ist die Abkürzung, wenn Latenz und Kosten wichtiger sind als Tiefe. Gegenüber GPT-4o mini (0,15 / 0,60 USD) ist nano sowohl billiger als auch leistungsstärker auf Text-Benchmarks, und bietet das achtfache Kontextfenster (1M vs. 128K). Für Low-Latency-Anwendungen wie Autocomplete, Tag-Extraktion aus Logs oder Inline-Moderation ist es 2026 die rationale OpenAI-Wahl.