Qwen 3
Alibaba · Qwen 3
Qwen-3-Modellfamilie von Alibaba Cloud, am 28./29. April 2025 veröffentlicht. Deckt dichte Modelle (0,6B / 1,7B / 4B / 8B / 14B / 32B) und MoE-Varianten (30B-A3B, 235B-A22B) ab - alle unter Apache 2.0. Hybrider Reasoning-Modus mit bis zu 38K Thinking-Tokens. Qwen3 Max (Cloud-Flagship) bietet 262K Kontext zu 0,78 / 3,90 USD pro Million Tokens; die spätere 2507-Variante kann sogar 1 Mio. Tokens verarbeiten. Stärkste offen-lizenzierte Familie aus China Anfang 2026.
Apache-2.0-Gewichte erlauben Self-Hosting in der EU. Alibaba-Cloud- API läuft über China oder Singapore - für DSGVO-Compliance Self- Hosting oder westlicher Hoster notwendig. Standard-DPA von Alibaba Cloud existiert, ist aber juristisch komplexer als bei EU-Anbietern.
Stärken
- Apache-2.0-Lizenz über die gesamte Modell-Palette
- Hybrider Reasoning-Modus erlaubt selektive Thinking-Tokens
- Sehr breite Größenauswahl (0,6B bis 235B MoE)
- 262K Kontext beim Cloud-Flagship Qwen3 Max
Schwächen
- Cloud-API über Alibaba China-Infrastruktur - DSGVO-Prüfung nötig
- Dichte Modelle größer als 32B nicht offen verfügbar
- Spezielle 2507/Coder-Varianten getrennt zu evaluieren
Qwen 3 ist Alibabas Antwort auf Llama 4 und DeepSeek V3 - und die breiteste Open-Weight-Familie am Markt. Wer ein 4B-Modell für Edge- Deployments und gleichzeitig ein 235B-MoE für Server-Workloads braucht, bekommt beides aus einer Hand mit konsistentem Tokenizer und gleicher Apache-2.0-Lizenz. Gegenüber Llama 4 Scout verliert Qwen 3 beim Kontextfenster (262K vs. 10M), gewinnt aber bei der Modellpalette und beim hybriden Reasoning-Modus.