Zwei Arten von Wissensgraphen

In der Fachliteratur werden zwei Ansätze unter diesem Begriff geführt, die technisch stark unterschiedlich sind.

Klassische Knowledge Graphs (RDF, Wikidata, Neo4j) extrahieren Entitäten aus Texten — Personen, Bauteile, Orte — und verbinden sie über explizit modellierte Relationen wie „hat_Hersteller” oder „besteht_aus”. Der Aufbau erfordert eine Ontologie und aufwändige Extraktionsprozesse.

Vektorbasierte Ähnlichkeitsgraphen bauen auf den Embeddings der Dokumente auf. Die Kantenlänge ergibt sich direkt aus der semantischen Ähnlichkeit im Vektorraum — keine Ontologie, keine Entitätsextraktion. Vektorbasierte Graphen entstehen automatisch mit der Indexierung und bilden ab, wie ähnlich Inhalte zueinander sind, ohne dass Relationen manuell definiert werden.

Mehrwert gegenüber Ordnerstrukturen

Ordnerstrukturen erfordern, dass der Nutzer weiß, wo ein Dokument abgelegt ist. Ein Wissensgraph zeigt thematische Zusammenhänge unabhängig von der Ablagestruktur. Ein Qualitätsprüfbericht, eine Arbeitsanweisung und ein Schulungsvideo zum selben Thema erscheinen als Cluster — auch wenn sie in unterschiedlichen Ordnern liegen.

Einsatz in Solid Qubits

Solid Qubits nutzt den vektorbasierten Ansatz. Knoten sind Dokumente, Bilder und Videos aus der Wissensbasis. Die Kantenlänge basiert auf semantischer Ähnlichkeit der zugehörigen Embeddings: Inhalte zum selben Themenfeld ziehen sich im Graph zusammen, thematisch entfernte Inhalte rücken auseinander. Der Graph entsteht automatisch beim Indexieren und aktualisiert sich, sobald neue Dokumente hinzukommen — ohne dass eine Ontologie oder explizite Verknüpfungen gepflegt werden müssen.