Was ist Retrieval-Augmented Generation (RAG)?
RAG kombiniert ein Sprachmodell mit einer externen Wissensdatenbank. Statt ausschließlich auf Trainingswissen zu basieren, sucht das Modell zuerst relevante Dokumente und nutzt diese als Kontext für die Antwort.
DEFINITION
Das Problem mit reinen Sprachmodellen: Sie wissen nur, was sie beim Training gelernt haben. Interne Dokumente, aktuelle Daten, firmenspezifisches Wissen kennen sie nicht. RAG löst das.
In einem RAG-System passiert folgendes: Zuerst durchsucht das System einen Vektorspeicher nach relevanten Dokumenten zur Frage. Die gefundenen Abschnitte gehen dann zusammen mit der ursprünglichen Frage an das Sprachmodell. Das Modell antwortet auf Basis dieser konkreten Dokumente statt aus dem Gedächtnis. Dadurch sinkt das Risiko von Halluzinationen erheblich, und Antworten sind nachvollziehbar quellenbasiert.
RAG ist heute die wichtigste Architektur für Unternehmens-KI: Chatbots, die auf internen Handbüchern basieren, Assistenten, die aktuelle Rechtslage kennen, oder Support-Systeme, die auf Produktdokumentation zugreifen.
VERBINDUNGEN ZU ANDEREN THEMEN
Führung
RAG-Systeme machen Führungswissen skalierbar: Wenn das Wissen erfahrener Führungskräfte strukturiert dokumentiert ist, kann ein RAG-Assistent dieses Wissen für das gesamte Team zugänglich machen, unabhängig davon, ob die Person gerade verfügbar ist.
Agilität
RAG-Systeme können das Produkt-Backlog, vergangene Retrospektiven und interne Wikis durchsuchen und gezielt beantworten. Das beschleunigt Backlog-Refinements und gibt neuen Teammitgliedern schnellen Kontext.
Projektmanagement
In Projekten mit umfangreicher Dokumentation gibt RAG Projektleitern schnell Zugriff auf Lessons Learned früherer Projekte, Vertragsdetails oder Stakeholder-Präferenzen, ohne stundenlange Recherche.
DAS WICHTIGSTE AUF EINEN BLICK
- RAG kombiniert Sprachmodell-Intelligenz mit externem, aktuellem Wissen.
- Es reduziert Halluzinationen, weil Antworten auf konkreten Dokumenten basieren.
- RAG macht interne Daten für KI-Assistenten zugänglich, ohne Fine-Tuning.
- Die Qualität des Systems hängt direkt von der Qualität der eingepflegten Dokumente ab.
PRAXISBEISPIEL
Ein Beratungsunternehmen baut einen internen KI-Assistenten auf Basis von RAG: Das System kennt alle vergangenen Projektberichte, internen Leitfäden und Methodendokumente. Berater können jetzt fragen „Welche Ansätze haben wir bei ähnlichen Change-Projekten eingesetzt?” und erhalten in Sekunden strukturierte Antworten mit Quellenangaben, anstatt selbst die Ablage zu durchsuchen.
HÄUFIGE MISSVERSTÄNDNISSE
Ist RAG dasselbe wie Fine-Tuning?
Nein. Fine-Tuning verändert die Modellgewichte durch Training auf neuen Daten. RAG lässt das Modell unverändert und gibt ihm stattdessen zur Laufzeit relevante Dokumente als Kontext. RAG ist schneller einzurichten und einfacher aktuell zu halten.
Macht RAG Halluzinationen unmöglich?
Nein, aber es reduziert sie erheblich. Das Modell kann immer noch Informationen aus den bereitgestellten Dokumenten falsch interpretieren oder über deren Inhalt hinausgehen. Quellenangaben in der Antwort ermöglichen menschliche Kontrolle.