Warum beides nötig ist

Semantische Suche versteht Bedeutung, hat aber Schwächen bei exakten Begriffen. Die Suche nach Artikelnummer „DIN EN ISO 9001” oder dem Kundennamen „Müller GmbH” funktioniert mit Stichwortsuche zuverlässiger. Umgekehrt findet Stichwortsuche nur exakte Treffer und scheitert an Synonymen oder Umschreibungen.

Hybrid Search löst dieses Dilemma: Fachbegriffe, Normnummern und Eigennamen werden per Stichwortsuche gefunden, inhaltliche Zusammenhänge per Vektorsuche.

Gewichtung der Ergebnisse

Der De-facto-Standard zur Zusammenführung beider Ergebnislisten ist Reciprocal Rank Fusion (RRF): Jedes Ergebnis erhält einen Score basierend auf seiner Rangposition in beiden Listen; die Summe bestimmt die Endreihenfolge. Alternative Verfahren gewichten die Roh-Scores beider Suchen linear — erfordern dann aber eine Kalibrierung, damit die unterschiedlichen Score-Skalen vergleichbar sind.

Einsatz in Solid Qubits

Solid Qubits nutzt Hybrid Search als Standard-Suchmethode. Das System kombiniert Vektorsuche mit BM25-Stichwortsuche und optimiert die Ergebnisse durch anschließendes Reranking.