DALL·E 3
OpenAI · DALL·E
Text-zu-Bild-Modell von OpenAI, im Oktober 2023 öffentlich gestartet. Deutlich besseres Prompt-Verständnis als DALL·E 2 - vor allem bei längeren Anweisungen, Text in Bildern und schwierigen Details wie Händen. Tief integriert in ChatGPT (Plus, Team, Enterprise) und über die Bilder-API verfügbar. Nicht token-, sondern bild-basiert abgerechnet (0,04 USD pro Standard-1024², 0,08 USD HD oder größer). Lehnt automatisch Bilder ab, die lebende Personen oder lebende Künstler nachahmen.
Über die OpenAI-API mit EU-Datenresidenz „at rest" für Enterprise- Kunden, Inferenz US-basiert. Bing Image Creator hat eigene Microsoft-Datenverarbeitung mit dokumentierter EU-Residenz für Enterprise-Tenants.
Stärken
- Stärkstes Text-Rendering im Bild der bekannten Mainstream-Modelle
- Konversationelle Iteration direkt im ChatGPT-Chat
- Per Bing Image Creator kostenlos nutzbar
- Enterprise-Setup mit dokumentierter EU-Datenresidenz möglich
Schwächen
- Kein „kinematografischer" Look à la Midjourney V7/V8
- Keine Charakter-Konsistenz über Bildserien (kein Omni-Reference)
- Bildgenerations-Limit im Plus-Plan (~50 / 3 h)
DALL·E 3 (inzwischen abgelöst von GPT Image als ChatGPT-Default) bleibt 2026 die zugänglichste Bild-API der OpenAI-Welt. Gegenüber Midjourney V7/V8 ist DALL·E 3 schwächer in Ästhetik und Stil-Konsistenz, aber deutlich stärker bei lesbarem Text und konversationeller Iteration. Gegenüber Stable Diffusion 3.5 (Open-Weight) ist DALL·E 3 nicht selbst hostbar, dafür aber kostenlos via Bing zugänglich. Für UI-Mockups und Marketing-Texte im Bild ist DALL·E 3 die Default-Empfehlung.