GPT-4.1 nano

OpenAI · GPT-4.1

Zuletzt geprüft 23. April 2026

Kleinste und schnellste Variante der GPT-4.1-Familie, ebenfalls am 14. April 2025 gestartet. Trotz kleinster Größe behält GPT-4.1 nano das 1M-Token-Kontextfenster und übertrifft GPT-4o mini auf MMLU (80,1 %) sowie bei Coding (Aider polyglot 9,8 %). Bei 0,10 / 0,40 USD pro Million Tokens ist es das günstigste OpenAI-Modell im API. Positioniert für Autocomplete, Klassifikation und Extraktion aus langen Dokumenten - nicht für Reasoning oder kreatives Schreiben.

Über Azure OpenAI mit EU-Datenresidenz; OpenAI-Direkt-API mit EU-Residenz "at rest" für Enterprise/Edu/API seit 2025, Inferenz US-basiert.

Stärken

  • Günstigstes OpenAI-Modell (0,10 / 0,40 USD pro Mio. Tokens)
  • 1M-Token-Kontext trotz kleiner Modellgröße
  • Niedrigste Latenz in der OpenAI-Palette
  • Schlägt GPT-4o mini auf MMLU, GPQA und Aider-Coding

Schwächen

  • Deutlich schwächer als GPT-4.1 mini bei komplexen Reasoning-Ketten
  • 32K Output-Limit, wie alle 4.1er-Varianten
  • Kein Reasoning-Modus, keine tiefen Logik-Ketten möglich

GPT-4.1 nano ist die Abkürzung, wenn Latenz und Kosten wichtiger sind als Tiefe. Gegenüber GPT-4o mini (0,15 / 0,60 USD) ist nano sowohl billiger als auch leistungsstärker auf Text-Benchmarks, und bietet das achtfache Kontextfenster (1M vs. 128K). Für Low-Latency-Anwendungen wie Autocomplete, Tag-Extraktion aus Logs oder Inline-Moderation ist es 2026 die rationale OpenAI-Wahl.