Funktionsweise im Detail

Ein RAG-System arbeitet in zwei Phasen, die klar zu trennen sind. Die Indexierung läuft einmalig vorab: Dokumente werden in Abschnitte zerlegt, als Vektoren in einer Vektordatenbank abgelegt und stehen danach als Wissensbasis zur Verfügung.

Das Retrieval passiert bei jeder Anfrage: Die Frage wird in einen Vektor umgewandelt, die Vektordatenbank liefert die inhaltlich passendsten Abschnitte, und das Sprachmodell formuliert auf Basis dieser Abschnitte eine Antwort. Der Vorgang läuft in Sekunden — aufwändig ist nur die einmalige Indexierung.

Der entscheidende Vorteil gegenüber reinem Prompting: Das Sprachmodell antwortet nicht aus dem Gedächtnis, sondern auf Grundlage konkreter Dokumente. Jede Antwort lässt sich mit Quellverweisen belegen.

RAG vs. Fine-Tuning

Fine-Tuning verändert die Modellgewichte dauerhaft — das Wissen wird eingebrannt. RAG lässt das Modell unverändert und stellt ihm bei jeder Anfrage die relevanten Dokumente zur Seite. Dokumente können jederzeit hinzugefügt oder entfernt werden, ohne das Modell anzufassen. Für die meisten industriellen Anwendungsfälle ist RAG die praktikablere und wartungsfreundlichere Lösung.

Nicht nur Text: Multimodales RAG

Moderne RAG-Systeme beschränken sich nicht auf Textdokumente. Mit multimodalen Modellen lassen sich auch Bilder als Wissensquelle einbetten — etwa Konstruktionszeichnungen, Schaltpläne oder Fotos aus der Qualitätsprüfung. Fortgeschrittene RAG-Systeme indexieren neben Text und Bildern auch Videos. Audio- und Bildspur werden dabei getrennt verarbeitet und anschließend in der gemeinsamen Wissensbasis zusammengeführt — praktisch etwa bei Schulungsaufnahmen, gefilmten Arbeitsanweisungen und Qualitätsprüfungen.

Relevanz für die Industrie

RAG macht Unternehmenswissen maschinenlesbar und durchsuchbar — Arbeitsanweisungen, Prüfprotokolle, technische Dokumentationen, Bilder und Videos. Mitarbeiter stellen Fragen in natürlicher Sprache und erhalten Antworten mit Verweis auf das Originaldokument. Das reduziert Suchzeiten und macht implizites Wissen für die gesamte Organisation zugänglich.