Llama 4 Scout
Meta · Llama 4
Kompakte Variante der Llama-4-Familie, am 5. April 2025 öffentlich gestartet. Nativ multimodal (Text + Bild), MoE-Architektur mit 17B aktiven Parametern aus 109B Total und 16 Experts. Branchenführend beim Kontextfenster mit 10 Mio. Tokens - der Sprung von 128K (Llama 3) ist die markanteste Neuerung. Passt damit auf eine einzelne H100 mit ausreichend RAM und ist auf 12 Sprachen multilingual trainiert. Trainingskorpus rund 40 Billionen Tokens.
Über AWS Bedrock (EU-Frankfurt) und Azure verfügbar - dann mit EU-Datenresidenz. Self-Hosting unter der Llama 4 Community Lizenz innerhalb der EU möglich, jedoch Lizenz-Restriktionen für Großplatt- formen. Meta-Direktzugriff läuft über US-Infrastruktur.
Stärken
- 10M-Token-Kontextfenster - größter am Markt für Open-Weight-Modelle
- Auf einer H100 lauffähig dank MoE-Architektur (17B aktiv)
- Nativ multimodal (Text + Bild) ab Werk
- 12 Sprachen multilingual, inkl. Deutsch
Schwächen
- Coding- und Reasoning-Benchmarks hinter Claude und DeepSeek
- Llama-4-Lizenz hat Einschränkungen bei großen Plattformen (>700M User)
- Multimodalität qualitativ unter Gemini 2.5 Pro und GPT-4.1
Scout ist die „bezahlbare” Llama-4-Variante - gegenüber dem Schwester- modell Maverick passt sie auf eine einzelne H100 und punktet vor allem mit dem 10M-Kontext. Für lange Codebases, ganze Bücher oder Forschungs- papiere im Prompt ist Scout aktuell konkurrenzlos. Im direkten Vergleich mit DeepSeek V3 0324 verliert Scout bei Coding und Reasoning, gewinnt aber bei Kontextlänge und freier Lizenz für westliche Cloud-Deployments.