Alle Beiträge

Daten & RAG-Architektur

AI-Knowledge-Management: RAG statt verstreutem Wissen

Firmenwissen liegt verstreut in Confluence, SharePoint und Mails — eine RAG-Wissensbasis liefert jedem Mitarbeiter sofort belegte Antworten.

Baybora Gülec17. Mai 20269 Min.

TL;DR

  • Vier KM-AI-Komponenten 2026 tragen den Stack: Cross-System-RAG (Vector-Index über Confluence, SharePoint, Tickets, Mails), Inhalts-Klassifikation (LLM clustert den Bestand), Knowledge-Gap-Identifikation (häufige Fragen ohne gute Antwort werden sichtbar) und Refresh-Triggers (LLM prüft Aktualität, schlägt Updates vor). Wer eine weglässt, baut eine Suchmaschine statt eine Wissensbasis.
  • 4–8 Stunden pro Woche Recherche-Ersparnis pro Wissensarbeiter sind belastbar, plus 25–40 % schnelleres Onboarding neuer Mitarbeiter.
  • Row-Level-Security im RAG-Store ist Pflicht, nicht nice-to-have. AI-Knowledge ohne PII-Filter plus breiter Zugang = Datenleak-Risiko. Owner-Pflicht pro Wissens-Block plus quartalsweiser Refresh-Review halten den Stack über die Zeit produktiv.

Vier KM-AI-Komponenten 2026

Knowledge-Management war 2018–2024 oft ein SharePoint-Friedhof — dokumentierte Prozesse veraltet, Suche nutzlos, Wissen in Tickets und Mails verborgen. 2026 macht AI das produktiv, aber nur wenn vier Komponenten parallel laufen.

Exhibit Tooling-Stack Knowledge-Management AI 2026 DACH-Mittelstand Glean Enterprise-Cloud US oder EU-Region waehlbar Per-Seat Enterprise-SaaS 80 bis 240 Tausend Euro pro Jahr schnellste Time-to-Value GoSearch Enterprise-Cloud EU-Hosting Per-Seat Enterprise-SaaS 40 bis 140 Tausend Euro pro Jahr Aboard Cloud plus On-Prem-Connector Subscription Mittelstand-fit 30 bis 90 Tausend Euro pro Jahr Microsoft Copilot for M365 M365-Tenant EU Per-Seat 30 bis 35 Euro pro Monat 40 bis 180 Tausend Euro pro Jahr Custom-Stack mit Anthropic plus Pinecone oder Qdrant Self-Hosted oder EU-Cloud Pay-per-Use plus Eigenbau 25 bis 85 Tausend Euro pro Jahr plus 0 Komma 3 FTE Senior-Architect Default-Empfehlung Mittelstand Custom-Stack mit Anthropic 50 Prozent guenstiger als Glean braucht aber 0 Komma 3 FTE Architect dauerhaft Glean ab 200 Millionen Euro Umsatz mit 5 plus Wissens-Channels und Compliance-Pflicht Build-vs-Buy-Entscheidung nicht Tooling-Entscheidung
Exhibit 2: Tooling-Stack 2026 — fünf dominante Komponenten mit Hosting, License und Cost. Default für Mittelstand ist Custom-Stack mit Anthropic, Enterprise-Suites erst ab Umsatz.

Cross-System-RAG: Ein Vector-Index über alle Quellen — Confluence, SharePoint, Helpdesk-Tickets, Mail-Threads, Doku-Repos. Der Mitarbeiter fragt in natürlicher Sprache, AI antwortet mit Citation auf das Quellsystem. Citation ist Pflicht, sonst ist es generischer LLM-Output. Die Adherence-Rate auf valide Citations liegt mit ordentlichem Reranker bei 85–94 % — ohne Reranker unter 60 %.

Inhalts-Klassifikation: Das LLM clustert Bestands-Dokumente nach Domäne, Zielgruppe, Sensitivitäts-Level und Lebenszyklus-Phase. Was vorher Ordner-Struktur war, läuft jetzt als Metadaten-Layer mit LLM-Vorschlägen plus Owner-Bestätigung. 78–88 % First-Pass-Korrektheit sind erreichbar; ohne menschlichen Review-Schritt driftet das Cluster-Modell.

Knowledge-Gap-Identifikation: Das LLM analysiert Such-Logs und Chat-Anfragen und erkennt häufige Fragen ohne gute Antwort. Statt zu raten, sieht der Owner ein Ranking — etwa „14 Mitarbeiter haben in vier Wochen nach SAP-Berechtigungen für die Lagerverwaltung gefragt, keine Antwort über Citation." Typisch werden in den ersten 90 Tagen 40–80 Gap-Pattern identifiziert.

Knowledge-Refresh-Triggers: Das LLM prüft die Aktualität der Wissens-Blöcke gegen Quellsysteme, Datums-Marker und Owner-Bestätigung. Ist ein Stück älter als zwölf Monate oder hatte ein referenziertes System ein Major-Update, geht ein Refresh-Vorschlag an den Owner. Ohne Triggers driftet jede Basis still — typisch 30–50 % Veraltung in 18 Monaten; mit Triggers bleibt sie unter 10 %, sofern Owner in 2–4 Wochen reagieren.

Tooling-Stack 2026

Default 2026 für Mittelstand ist ein Custom-Stack mit Anthropic plus Custom-RAG — Enterprise-Suites lohnen sich erst ab größeren Umsätzen und 5+ Wissens-Channels.

ToolHostingLicense
GleanEnterprise-Cloud (US/EU wählbar)Per-Seat, Enterprise-SaaS
GoSearchEnterprise-Cloud, EU-HostingPer-Seat, Enterprise-SaaS
AboardCloud + On-Prem-ConnectorSubscription, Mittelstand-fit
Microsoft Copilot for M365M365-Tenant (EU)Per-Seat
Custom-Stack (Anthropic + Pinecone/Qdrant)Self-Hosted oder EU-CloudPay-per-Use + Eigenbau

In DACH-Pilots zeigt sich: Glean liefert die schnellste Time-to-Value, ein Custom-Stack mit Anthropic kostet deutlich weniger, braucht aber dauerhaft 0,3 FTE Senior-Architect. Die Wahl ist eine Build-vs-Buy-Frage, keine Tooling-Frage.

Sicherheits-Layer

Drei Komponenten entscheiden, ob der Stack über Audits und Datenschutz-Reviews kommt. Die Reihenfolge ist nicht beliebig — Row-Level-Security ist die Eintritts-Karte:

Pilot-Cockpit 130 Millionen Euro sueddeutscher Industrie-Mittelstand 480 Mitarbeitende KM-AI-Stack ueber 6 Monate November 2025 bis April 2026 Ausgangslage 11 Jahre Confluence-Wildwuchs 23 Prozent der Suchen erfolglos Onboarding Solutions-Engineer 9 Wochen Phase 1 Monat 1 Audit 14 Komma 2 Tausend Wissens-Bloecke gesichtet 38 Prozent als veraltet markiert Owner fuer 62 Prozent unklar Baseline Onboarding 9 Komma 0 Wochen Phase 2 Monat 2 bis 3 Cross-System-RAG Confluence plus SharePoint plus Helpdesk indexiert Custom-Anthropic-Stack mit Qdrant Row-Level-Security aktiviert Onboarding 9 Komma 0 auf 7 Komma 2 Wochen minus 20 Prozent Phase 3 Monat 4 Klassifikation plus Gap-Identifikation 11 Komma 8 Tausend Dokumente automatisch klassifiziert 56 Knowledge-Gaps identifiziert 22 als kritisch priorisiert Onboarding 7 Komma 2 auf 6 Komma 4 Wochen minus 11 Prozent Phase 4 Monat 5 bis 6 Refresh-Triggers plus Audit-Trail 31 Prozent der veralteten Dokumente aktualisiert oder archiviert Audit-Log aktiv Onboarding 6 Komma 4 auf 5 Komma 4 Wochen minus 16 Prozent Gesamt-Impact Onboarding 9 auf 5 Komma 4 Wochen minus 40 Prozent Recherche-Ersparnis 6 Stunden pro Woche pro Wissensarbeiter Investment 95 Tausend Euro Setup plus 28 Tausend Euro pro Jahr Run-Rate Amortisation in Monat 5
Exhibit 3: 6-Monats-Pilot Industrie-Mittelstand — Onboarding 9 → 5,4 Wochen (−40 %), 6 Std/Woche Recherche-Ersparnis pro Wissensarbeiter.
  • Row-Level-Security: Jeder Wissens-Block trägt Berechtigungs-Metadaten, die der RAG-Store bei jedem Query auf den Anfrager prüft. HR-Doku ist nicht für Engineering sichtbar, Sales-Margen nicht für Operations. RLS muss in der Retrieval-Schicht erzwungen werden, nicht erst in der LLM-Antwort — sonst lecken Kontextdaten durch Citation-Snippets.
  • PII-Filter: Vor der Ingestion läuft jedes Dokument durch einen PII-Detection-Layer — Namen, Adressen, IBANs, Personal-Nummern werden maskiert oder mit Berechtigungs-Flags versehen. PII-Filter erst nach Embedding ist zu spät; dann sind Identifier bereits im Vektor-Raum.
  • Audit-Trail: Jeder Query wird mit User-ID, Quell-Citations und Antwort-Hash geloggt. Bei DSGVO-Audits ist nachvollziehbar, wer was wann gefragt hat. Aufbewahrung typisch 12–24 Monate, dann Auto-Delete oder Pseudonymisierung.

Pilot und Anti-Patterns

Ein süddeutscher Industrie-Mittelständler (rund 480 Mitarbeiter) führte den Stack über sechs Monate ein. Ausgangslage: elf Jahre Confluence-Wildwuchs, 23 % erfolglose Suchen, Onboarding eines Solutions-Engineers neun Wochen. Ergebnis: Onboarding 9 → 5,4 Wochen, 56 Knowledge-Gaps identifiziert (22 kritisch), 31 % der veralteten Dokumente aktualisiert oder archiviert. Der unerwartete Hebel war die Gap-Identifikation: Erst die Such-Log-Analyse machte sichtbar, dass 40 % der Anfragen rund um drei nie ordentlich dokumentierte Themen-Cluster liefen.

Drei Anti-Patterns sehen wir bei der Mehrheit der KM-AI-Anfragen:

  • Kein RLS: breiter Zugang ohne Row-Level-Security — Engineering sieht HR-Doku, Praktikant sieht Vorstands-Protokolle. „RLS bauen wir in Phase 2" — Phase 2 kommt nicht, der Leak schon.
  • Kein Owner: Blöcke ohne benannten Owner veralten unkontrolliert; nach 18 Monaten ist 40–60 % der Basis nicht mehr vertrauenswürdig, Mitarbeiter fallen auf Ad-hoc-Slack-Suche zurück.
  • Kein Refresh-Trigger: ein Stichtags-Snapshot mit Halbwertszeit von 6–9 Monaten. AI antwortet selbstbewusst mit veralteten Citations, der Stack stirbt politisch.

Default-Setup 2026

Die Default-Empfehlung: Glean oder Custom-Stack mit Anthropic plus RLS plus Owner-Pflicht plus Refresh-Trigger plus Quartals-Review. Wer diese fünf Komponenten hält, baut eine Capability, die über 24 Monate produktiv bleibt — und nicht in den nächsten SharePoint-Friedhof driftet.

Praxis-Schritt: Ein AI Readiness Audit klärt, welche Wissens-Quellen Indexier-Hebel haben, prüft die RLS-Fähigkeit der Quellsysteme und liefert die Build-vs-Buy-Empfehlung für Ihr Mitarbeiter- und Compliance-Profil. Audit anfragen → /anfrage

Disclaimer: KM-AI-Implementierungen sind organisations- und compliance-spezifisch — Azena begleitet AI-Architektur und Tool-Auswahl, die finale Datenschutz- und Berechtigungs-Validierung erfolgt durch Ihre Datenschutz- und IT-Security-Verantwortlichen.

Stand Mai 2026. AI-Beratung für Knowledge-Management im DACH-Mittelstand mit Schwerpunkt MedTech, Maschinen- und Anlagenbau, Familienunternehmen — eigene BAFA-/go-digital-Akkreditierung in Vorbereitung Q3 2026, Förder-Pfade aktuell in Kooperation mit akkreditierten Partner-Beratungen.

Baybora Gülec· Gründer, Azena

Nächster Schritt

Passt das auf Ihren Fall?

30-Min-Erstgespräch, kostenfrei und unverbindlich. Wir gehen Ihren konkreten Fall durch — und sagen ehrlich, wenn nichts passt.

Teilen LinkedIn Per E-Mail