Llama 4 Scout

Meta · Llama 4

Zuletzt geprüft 23. April 2026

Kompakte Variante der Llama-4-Familie, am 5. April 2025 öffentlich gestartet. Nativ multimodal (Text + Bild), MoE-Architektur mit 17B aktiven Parametern aus 109B Total und 16 Experts. Branchen­führend beim Kontextfenster mit 10 Mio. Tokens - der Sprung von 128K (Llama 3) ist die markanteste Neuerung. Passt damit auf eine einzelne H100 mit ausreichend RAM und ist auf 12 Sprachen multilingual trainiert. Trainings­korpus rund 40 Billionen Tokens.

Über AWS Bedrock (EU-Frankfurt) und Azure verfügbar - dann mit EU-Datenresidenz. Self-Hosting unter der Llama 4 Community Lizenz innerhalb der EU möglich, jedoch Lizenz-Restriktionen für Großplatt- formen. Meta-Direktzugriff läuft über US-Infrastruktur.

Stärken

  • 10M-Token-Kontextfenster - größter am Markt für Open-Weight-Modelle
  • Auf einer H100 lauffähig dank MoE-Architektur (17B aktiv)
  • Nativ multimodal (Text + Bild) ab Werk
  • 12 Sprachen multilingual, inkl. Deutsch

Schwächen

  • Coding- und Reasoning-Benchmarks hinter Claude und DeepSeek
  • Llama-4-Lizenz hat Einschränkungen bei großen Plattformen (>700M User)
  • Multimodalität qualitativ unter Gemini 2.5 Pro und GPT-4.1

Scout ist die „bezahlbare” Llama-4-Variante - gegenüber dem Schwester- modell Maverick passt sie auf eine einzelne H100 und punktet vor allem mit dem 10M-Kontext. Für lange Codebases, ganze Bücher oder Forschungs- papiere im Prompt ist Scout aktuell konkurrenzlos. Im direkten Vergleich mit DeepSeek V3 0324 verliert Scout bei Coding und Reasoning, gewinnt aber bei Kontextlänge und freier Lizenz für westliche Cloud-Deployments.