Wie Vektordatenbanken funktionieren

Jedes Dokument wird beim Einfügen in seine Bestandteile zerlegt (Chunking), und jeder Abschnitt wird durch ein Embedding-Modell in einen hochdimensionalen Vektor umgewandelt. Die Vektordatenbank speichert diese Vektoren und baut einen Index auf, der effiziente Ähnlichkeitssuchen ermöglicht.

Bei einer Anfrage wird die Frage ebenfalls in einen Vektor umgewandelt. Die Datenbank vergleicht diesen Vektor mit allen gespeicherten Vektoren und liefert die inhaltlich nächsten Treffer zurück — unabhängig davon, ob die exakten Wörter übereinstimmen.

Um Millionen von Vektoren in Millisekunden durchsuchen zu können, verwenden Vektordatenbanken spezialisierte Indexstrukturen. Am verbreitetsten sind HNSW (Hierarchical Navigable Small World) und IVF (Inverted File Index). Beide Verfahren verzichten auf einen exakten Vergleich mit jedem gespeicherten Vektor und nähern sich stattdessen dem besten Treffer über Näherungsverfahren — mit minimalen Einbußen in der Trefferqualität.

Abgrenzung zu klassischen Datenbanken

Relationale Datenbanken suchen nach exakten Übereinstimmungen oder vordefinierten Kriterien. Vektordatenbanken finden Inhalte nach semantischer Ähnlichkeit. Eine Suche nach „Stahl wird brüchig bei Kälte” findet ein Dokument über Tieftemperaturversprödung, ohne dass die Begriffe identisch sein müssen.

Bedeutung für On-Premise-KI

Für Industrieunternehmen ist die Vektordatenbank die Brücke zwischen ihrem vorhandenen Dokumentenbestand und dem Sprachmodell. Die Qualität der Antworten hängt direkt davon ab, wie gut die Vektordatenbank relevante Abschnitte findet. Deshalb ist die Wahl der Embedding-Strategie, der Chunk-Größe und des Indexierungsverfahrens entscheidend für die Antwortqualität des Gesamtsystems.

Verbreitete Open-Source-Systeme sind Qdrant, Milvus, Weaviate und Chroma. Für Unternehmen, die bereits PostgreSQL betreiben, ist die Erweiterung pgvector häufig die pragmatischste Wahl, weil sie die Vektorsuche in eine bestehende Datenbanklandschaft integriert.