Retrieval Augmented Generation (RAG) — einfach erklärt

Retrieval Augmented Generation (RAG) ist eine Methode, bei der ein Large Language Model nicht nur auf sein Trainingswissen zurückgreift, sondern zusätzlich relevante Informationen aus externen Datenquellen abruft und in seine Antwort einbezieht. Der Prozess läuft in zwei Schritten ab: Zuerst werden aus einer Wissensdatenbank die relevantesten Dokumente oder Textabschnitte abgerufen (Retrieval), dann nutzt das Sprachmodell diese als Kontext für die Generierung einer fundierten Antwort (Generation).

RAG löst eines der zentralen Probleme von Large Language Models: das begrenzte und potenziell veraltete Trainingswissen. Während ein Standard-LLM nur auf die Daten zurückgreifen kann, mit denen es trainiert wurde, hat ein RAG-System Zugriff auf aktuelle, unternehmensspezifische Informationen. Produktkataloge, interne Wissensdatenbanken, Richtlinien oder Kundendaten können als Datenquelle angebunden werden.

Technisch basiert RAG auf Embeddings – numerischen Repräsentationen von Text, die eine semantische Suche ermöglichen. Wenn eine Frage gestellt wird, wird sie in einen Embedding-Vektor umgewandelt und mit den Vektoren der gespeicherten Dokumente verglichen. Die relevantesten Treffer werden dem LLM als Kontext übergeben. Dadurch sind die Antworten faktenbasiert und nachvollziehbar.

Bedeutung für Unternehmen

RAG ist für viele Unternehmen der praktikabelste Weg, KI mit eigenem Wissen zu verbinden. Im Vergleich zu Fine-Tuning ist RAG schneller implementiert, leichter aktualisierbar und erfordert weniger technische Ressourcen. Die Wissensbasis kann jederzeit erweitert oder aktualisiert werden, ohne das Modell neu trainieren zu müssen. Typische Anwendungsfälle sind interne Chatbots für Mitarbeitende, intelligente FAQ-Systeme für Kunden oder Assistenten für die Dokumentenrecherche.

Praxisbeispiel

Ein IT-Dienstleister implementiert einen RAG-basierten Chatbot für seinen Kundensupport. Der Bot greift auf die gesamte technische Dokumentation, bekannte Fehler und Lösungswege zu. Stellt ein Kunde eine Frage, durchsucht das System die Wissensdatenbank, findet die relevanten Artikel und formuliert eine verständliche Antwort mit Quellenangabe. Die Erstlösungsquote steigt von 40 auf 72 Prozent.

Das lernen Sie im Seminar

Im KI Seminar für Fortgeschrittene erfahren Sie, wie RAG-Systeme funktionieren und wie Sie diese Technologie für Ihr Unternehmen einsetzen. Sie lernen die Architektur kennen und verstehen, welche Voraussetzungen für eine erfolgreiche Implementierung notwendig sind.