Jamba 1.5 Large

AI21 Labs · Jamba

Zuletzt geprüft 23. April 2026

Hybrid-Architektur-Modell von AI21 Labs, am 22. August 2024 veröffentlicht. Verbindet Transformer mit Mamba-State-Space-Layern und Mixture-of-Experts - 398B Total / 94B aktiv pro Token. 256K Kontext, der laut RULER-Benchmark auch tatsächlich nutzbar bleibt (kein Quality-Drop in den hinteren Bereichen). Bei 2 / 8 USD pro Million Tokens preislich auf Niveau von o3, dafür aber mit dem in der Praxis am längsten validierten Kontextfenster.

AI21 Labs bietet Standard-DPA für Enterprise-Kunden. Cloud-API läuft über Microsoft Azure und AWS Bedrock - beide bieten EU- Datenresidenz. Self-Hosting unter Jamba Open Model License erlaubt EU-eigenen Betrieb.

Stärken

  • Validiertes 256K-Kontextfenster ohne Qualitätseinbruch (RULER)
  • SSM-Transformer-Hybrid mit Mamba-Effizienz
  • Open-Weights via Hugging Face - Self-Hosting möglich
  • AI21 als israelisches Unternehmen mit westlichem Rechtsrahmen

Schwächen

  • Preise auf o3-Niveau ohne dediziertes Reasoning-Profil
  • Mainstream-Coding-Benchmarks unter Claude Sonnet 4
  • Self-Hosting wegen 398B Parametern Cluster-Investition nötig

Jamba 1.5 ist die produktive Antwort auf die Frage, ob hybride SSM-Architekturen mit Transformern konkurrenzfähig sind. Im Long-Context-Vergleich gewinnt Jamba auf RULER gegen Claude und GPT, weil viele Anbieter in den hintersten 10 % ihres deklarierten Kontextfensters spürbar an Qualität verlieren. Gegenüber Claude Opus 4.7 (1M Kontext, 5 / 25 USD) ist Jamba günstiger und genauso „echt” im Long-Context - aber kleiner im max. Kontextumfang.