Lokale Inferenz bietet die höchste Kontrolle über Ihre Daten — sie verlassen das Unternehmen nicht. Das setzt voraus, dass Sie die passende Hardware bei sich stehen haben: dimensioniert auf Ihre Nutzerzahl, ausgelegt auf den 24/7-Dauerbetrieb und gebaut aus Komponenten, die für Rechenzentren qualifiziert sind. Genau solche Systeme liefern wir.

KI-Workloads haben andere Anforderungen

Eine Hardware für klassische Büroanwendungen unterscheidet sich deutlich von einer Hardware für Sprachmodelle, Vektordatenbanken und multimodale Inferenz. KI-Workloads stellen besondere Anforderungen an:

  • Rechenleistung der GPU: Sprachmodelle und Embedding-Modelle sind speicher- und bandbreitenintensiv.
  • GPU-Speicher: moderne Sprachmodelle benötigen je nach Modellgröße zwischen 24 GB und 80 GB VRAM pro GPU.
  • CPU-Kerne und Arbeitsspeicher: die Vektordatenbank, das Retrieval und die Dokumentenindexierung laufen parallel zur Inferenz.
  • Speicher- und Datenpfad-Integrität: bei Dauerlast und großen Wissensbeständen werden schleichende Bitfehler zum realen Risiko — daher End-to-End ECC statt einfacher ECC.
  • Storage-Durchsatz: Indexierung und Abruf großer Dokumentbestände fordern schnelle Datenträger mit konstanter Schreibrate.

Consumer-Komponenten — auch hochwertige — sind für diese Dauerlast nicht ausgelegt. Wir verbauen ausschließlich für Rechenzentrumsbetrieb qualifizierte Komponenten.

Eingesetzte Komponenten

Komponente Auswahl
Fehlerkorrektur End-to-End ECC auf Speicher- und Datenpfaden
Storage Data-Center-SSDs im RAID 1
CPU AMD Zen 5 Threadripper
GPU NVIDIA Blackwell Pro
Mainboard IPMI-fähig für Fernwartung
Kühlung Hochleistungs-Luftkühlung

Die konkrete Konfiguration leiten wir aus Ihrem Anwendungsfall ab — Nutzerzahl, Modellgröße, erwartete Indexgröße, Antwortzeit-Anforderungen und Platzierung (Serverraum, Rack, Edge).

KI-Workstations für einzelne Anwender

Neben rackfähigen Servern liefern wir KI-Workstations für Szenarien, in denen ein einzelner Anwender oder ein kleines Team lokale KI nutzt: Entwickler, Datenanalysten, Konstrukteure mit eigenen KI-Modellen oder Spezialwerkstätten ohne eigenen Serverraum. Workstations nutzen dieselbe Komponenten-Philosophie wie unsere Server, mit einem anderen Formfaktor und angepasster Kühlung für den Schreibtischeinsatz.

Gewährleistung und Upgrade-Pfade

Die Gewährleistung beträgt zwei Jahre und lässt sich optional auf bis zu sieben Jahre verlängern. Das ist in einem Feld mit schneller Modellentwicklung wichtig — nicht weil die Hardware schneller kaputtgeht, sondern weil Sie planerische Sicherheit für Abschreibung und Erneuerungszyklen brauchen.

Auf Wunsch beraten wir Sie zu Upgrade-Pfaden, damit Ihre Hardware mit dem Entwicklungstempo im KI-Umfeld Schritt halten kann — etwa durch Austausch einzelner GPUs statt Komplettersatz.

Hardware allein reicht nicht

Ein leistungsfähiger KI-Server ist nur so nützlich wie die Software, die darauf läuft, und die Integration, die ihn an Ihre bestehende IT anbindet. Wir liefern Hardware typischerweise im Paket mit unserer eigenen Standardsoftware oder im Rahmen eines Komplettsystems — etwa Solid Qubits. Einzelabnahmen nur für die Hardware sind ebenfalls möglich, wenn Sie Ihre Softwareplattform bereits gewählt haben.