Mistral Small 3

Mistral AI · Mistral Small

Zuletzt geprüft 23. April 2026

24-Milliarden-Parameter-Modell unter Apache-2.0-Lizenz, am 30. Januar 2025 veröffentlicht. Optimiert für Latenz und lokalen Betrieb, 32K Kontext, 0,10 / 0,30 USD pro Million Tokens via Mistral-API. Da es unter Apache 2.0 steht, kann Mistral Small 3 auch vollständig on-prem betrieben werden - ein Alleinstellungsmerkmal im Vergleich zu OpenAI, Anthropic oder Google. Damit deckt es zwei Szenarien ab: günstige Cloud-API und souveräne Eigenbetriebs-Installationen.

Cloud-API über Mistral-Infrastruktur in Paris; Apache-2.0-Lizenz erlaubt eigenständigen Betrieb innerhalb der EU ohne Datenfluss an externe Anbieter.

Stärken

  • Apache-2.0-Lizenz - volles On-Premise-Deployment ohne Vendor-Lock
  • 24B Parameter, praktikabel auf einzelnen GPUs betreibbar
  • EU-Anbieter mit DSGVO-Konformität im Cloud-API
  • Latenz-optimiert für interaktive Anwendungen

Schwächen

  • Nur 32K Kontext - kein Long-Document-Use-Case
  • Keine native Multimodalität (nur Text)
  • Benchmarks unter GPT-4.1 mini und Claude Sonnet bei ähnlichem Preis

Mistral Small 3 ist das Arbeitspferd für EU-Self-Hosting. Die Apache- 2.0-Lizenz unterscheidet es grundlegend von allen OpenAI-, Anthropic- und Google-Modellen, die proprietär bleiben. Für Kostenbewusste in der Cloud ist GPT-4.1 nano (0,10 / 0,40 USD) eine etwas günstigere Wahl, aber für Organisationen, die ihren KI-Stack selbst betreiben müssen, ist Mistral Small 3 heute das stärkste praktikable 24B-Modell neben Qwen 2.5 und DeepSeek-Varianten.