RAG in 12 Minuten erklärt

Kanal Aishwarya Srinivasan 12 Min English Einsteiger

Zuletzt geprüft 24. April 2026

Nach 12 Minuten kannst du RAG in eine lauffähige Enterprise-Architektur einordnen (Retrieval, Chunking, Embeddings, Vector DB, Prompts) und die passenden RAG-Patterns für deinen Use Case auswählen. Voraussetzung: keine bis grundlegendes Verständnis, wie LLMs Text generieren und was ein Suchindex ist.

Lernziele

  • Ich ordne RAG korrekt in den Ablauf aus Suche + Kontext + Antwort ein.
  • Ich wähle geeignete Chunking-Strategien und Embedding-Modelle für mein Datenmaterial aus.

Mit RAG löst du ein konkretes Problem: LLMs „wissen“ ohne zusätzliche Daten oft nicht, was in deinen Dokumenten steht. Du machst das Modell deshalb nutzbar für interne Infos, Richtlinien oder Wissensdatenbanken, indem du relevante Textstellen vorher holst und als Kontext in die Antwort einbindest.

Du bekommst eine klare Schrittfolge entlang der RAG-Pipeline: Erst lernst du, wie Retrieval wie ein „Open-Book“-Mechanismus funktioniert (Dokumente finden, dann beantworten). Danach siehst du, warum Chunking mehr ist als „Text in Stücke schneiden“: Du lernst Strategien, wie du Passagen so segmentierst, dass die Suche später brauchbare Treffer liefert. Als dritten Schwerpunkt nimmst du die Auswahl des Embedding-Modells und die Rolle der Vector Database mit: Welche Aufgabe übernimmt Embedding, und wie unterscheiden sich typische Stores wie Qdrant, Weaviate oder Pinecone in der Praxis? Abschließend ordnest du dir mehrere RAG-Patterns ein, sodass du nicht blind „eine“ Standardlösung kopierst, sondern ein Pattern zu deinem Ziel (z. B. Qualität, Geschwindigkeit, Struktur) passend auswählst.

Geeignet ist das für Product-nahe Rollen (PM/PMM/Go-to-market) und Einsteiger in AI-Engineering, die RAG schnell in Architektur-Begriffen greifen wollen. Wenn du bereits nur fertigen Code suchst oder sehr tief in Training/Fine-tuning einsteigen willst, bringt dir das Video weniger.

Discovery

Als Nächstes lernen