Mistral Small 3
Mistral AI · Mistral Small
24-Milliarden-Parameter-Modell unter Apache-2.0-Lizenz, am 30. Januar 2025 veröffentlicht. Optimiert für Latenz und lokalen Betrieb, 32K Kontext, 0,10 / 0,30 USD pro Million Tokens via Mistral-API. Da es unter Apache 2.0 steht, kann Mistral Small 3 auch vollständig on-prem betrieben werden - ein Alleinstellungsmerkmal im Vergleich zu OpenAI, Anthropic oder Google. Damit deckt es zwei Szenarien ab: günstige Cloud-API und souveräne Eigenbetriebs-Installationen.
Cloud-API über Mistral-Infrastruktur in Paris; Apache-2.0-Lizenz erlaubt eigenständigen Betrieb innerhalb der EU ohne Datenfluss an externe Anbieter.
Stärken
- Apache-2.0-Lizenz - volles On-Premise-Deployment ohne Vendor-Lock
- 24B Parameter, praktikabel auf einzelnen GPUs betreibbar
- EU-Anbieter mit DSGVO-Konformität im Cloud-API
- Latenz-optimiert für interaktive Anwendungen
Schwächen
- Nur 32K Kontext - kein Long-Document-Use-Case
- Keine native Multimodalität (nur Text)
- Benchmarks unter GPT-4.1 mini und Claude Sonnet bei ähnlichem Preis
Mistral Small 3 ist das Arbeitspferd für EU-Self-Hosting. Die Apache- 2.0-Lizenz unterscheidet es grundlegend von allen OpenAI-, Anthropic- und Google-Modellen, die proprietär bleiben. Für Kostenbewusste in der Cloud ist GPT-4.1 nano (0,10 / 0,40 USD) eine etwas günstigere Wahl, aber für Organisationen, die ihren KI-Stack selbst betreiben müssen, ist Mistral Small 3 heute das stärkste praktikable 24B-Modell neben Qwen 2.5 und DeepSeek-Varianten.