Alle Beiträge

Daten & RAG-Architektur

Data-Exfiltration: wie RAG und Embedding-Stores leaken

RAG-Setups und Embedding-Stores leaken sensible Daten auf Wegen, die viele unterschätzen — und welche Schutz-Pattern wirklich greifen.

Baybora Gülec17. Mai 20269 Min.

TL;DR

  • Drei Exfiltrations-Pfade sind 2026 Realität: RAG-Leakage über geschickte Prompts, Training-Data-Extraction aus Self-trained-Modellen, Embedding-Inversion aus Vector-Stores mit 70–90 % Rekonstruktions-Genauigkeit.
  • DSGVO trifft AI hart: Art. 15 Auskunfts- und Art. 17 Löschpflicht gelten auch für Embeddings und trainierte Gewichte — nicht trivial lösbar, vor allem nicht bei Self-Trained-Modellen.
  • Schutz-Pattern, das trägt: Row-Level-Security im Vector-Store (Postgres + pgvector), Metadaten-Filter-ACL, Differential-Privacy im Training, halbjährliche Pentest-Audits.

Drei Exfiltrations-Pfade 2026

Mittelstands-RAG-Systeme leaken durch drei abgrenzbare Pfade, jeder mit eigener Forensik und eigenem Schutz-Layer. Wer nur Pfad eins absichert, lässt zwei und drei offen.

DSGVO-Mapping-Matrix Art. 15 Auskunft Art. 17 Löschung Art. 22 Auto-Decision Art. 32 Sicherheit gegen AI-Tooling-Reality 2026
Exhibit 2: Art. 17 Löschung bei Fine-Tuned-Modellen technisch nicht erfüllbar — die zentrale Architektur-Entscheidung gegen schnelle Fine-Tunes auf produktiven Personendaten.

In DACH-Audits zeigt sich: Ein RAG-System ohne Row-Level-Security ist kein KI-Produkt — es ist ein offener Akten-Schrank mit Sprach-Interface.

Pfad 1 — RAG-Leakage via Prompt-Manipulation

Der häufigste Vektor. Ein User mit Read-Access auf ein Sub-Set der Wissensbasis formuliert eine Anfrage, die das LLM über die eigene Berechtigung hinaus antworten lässt — «Fasse die letzten zehn HR-Beschwerden zusammen.» Das LLM hat keinen Berechtigungs-Begriff; es antwortet aus dem Retriever-Kontext. Ohne Filter bekommt der User Daten, die er nie hätte sehen dürfen.

Schutz-Layer: Pre-Retrieval-ACL — die Query wird vor dem Vector-Search mit den User-Rollen kombiniert, nur Dokumente mit passendem acl_tag werden retrieved, plus Audit-Log jedes Treffers.

Pfad 2 — Training-Data-Extraction aus Self-Trained-Modellen

Wer eigene Modelle fine-tuned oder vortrainiert, hat dieses Problem. Forschung 2023–2025 (Carlini et al., Nasr et al.) zeigt: 0,5–2 % der Trainings-Examples lassen sich rekonstruieren — auf vertraulichen Vertrags-Corpora im Pilot reproduziert. Ein Fine-Tune auf zehntausend Lieferanten-Verträgen liefert auf «Vervollständige: Der Lieferant verpflichtet sich…» wortgetreue Passagen inklusive Namen und Konditionen.

Schutz-Layer: Differential Privacy im Training (DP-SGD mit ε ≤ 5), aggressive Deduplication und never fine-tune auf Personen-Daten ohne Rechtsgrundlage.

Pfad 3 — Embedding-Inversion aus Vector-DB

Der subtilste Pfad. Embeddings galten lange als «one-way». Forschung 2024 (Morris et al., «Text Embeddings Reveal Almost as Much as Text») widerlegt das: mit einem Inverter-Modell lassen sich aus OpenAI-, Cohere- oder BGE-Embeddings 70–90 % der Originaltexte semantisch rekonstruieren. Ein kompromittierter Vector-Store ist keine anonymisierte Sicherung, sondern eine invertierbare Klartext-Quelle; unverschlüsselte Backups sind ein Compliance-Risiko erster Ordnung.

Schutz-Layer: Vector-Store Encryption at rest mit kundenseitigen Keys, strikte Network-Isolation, Audit aller Embedding-Exports.

DSGVO + AI: Art. 15 Auskunft, Art. 17 Löschung

Die DSGVO-Pflichten gelten auch für AI-Systeme. Vier Artikel treffen besonders hart:

DSGVO-PflichtTooling-Reality 2026 + Lösung
Art. 15 AuskunftRAG via Metadaten-Filter machbar, Fine-Tune nicht trivial bestimmbar → RAG-Audit-Log + Quellen-Trace
Art. 17 LöschungRAG: Dokument-Delete + Re-Index; Fine-Tune: unmöglich ohne Re-Train → keine PII im Training
Art. 22 Auto-DecisionRAG mit Human-Review erlaubt, Vollautomatik verboten → HITL-Gate vor jeder Außenwirkung
Art. 32 SicherheitVerschlüsselung at rest, RLS, Audit-Logs → Pentest halbjährlich, dokumentiert

Der bittere Befund: Bei selbst trainierten Modellen ist Art. 17 in Reinform nicht erfüllbar — die zentrale Architektur-Entscheidung gegen «schnelle» Fine-Tunes auf produktiven Personendaten.

Schutz-Pattern: Row-Level-Security im Vector-Store

Der industrielle Standard 2026 ist Postgres + pgvector mit RLS — native SQL-RLS, ACID-Garantien, eine Datenbank für Dokumente und Vektoren. Jedes Chunk wird mit tenant_id, acl_tags[] und embedding gespeichert; der Cosine-Similarity-Search läuft nur auf Rows, die die RLS-Policy für den User-JWT freigibt — der Retrieval-Layer sieht niemals Rows außerhalb der ACL.

sql CREATE POLICY tenant_isolation ON doc_chunks USING (tenant_id = current_setting('app.tenant_id')::uuid AND acl_tags && current_setting('app.user_acl_tags')::text[]);

Plus drei Härtungs-Layer: Pre-Retrieval-Query-Sanitization gegen Prompt-Injection, Post-Retrieval-Quellen-Citation-Pflicht im Output und ein Audit-Log jeder Retrieval-Operation mit User-ID, Query-Hash und Treffer-Liste.

Pilot: MedTech, RAG-Audit

Pilot bei einem MedTech-Mittelständler: ein seit 14 Monaten produktives RAG-System über rund 120.000 Dokumente (Engineering-Specs, Audit-Reports, FDA/EMA-Korrespondenz). Die Findings, ungeschönt:

Pilot-Cockpit MedTech 100 Millionen Euro RAG-Audit Findings mit DSGVO-Bußgeld-Risiko und 8-Wochen-Fix-Plan
Exhibit 3: 6 Personentage Audit-Aufwand, 8 Wochen Fix-Plan — –400k DSGVO-Bußgeld-Risiko gegen Sanierungs-Investment.
BefundSchwere / Fix
Kein RLS — alle User sahen alle ChunksKritisch · 3 Wochen Re-Architecture
Embeddings in Bucket unverschlüsseltHoch · 1 Tag
Keine Audit-Logs der RetrievalsHoch · 1 Woche
LLM-Prompt-Injection-Filter fehltMittel · 1 Woche
PII in Trainings-Daten (2.300 Patient-Records)Kritisch · Re-Train + Delete

Sechs Personentage Audit, acht Wochen Fix-Plan. Der wichtigste Befund war nicht Pfad eins oder drei, sondern die PII-Verseuchung der Trainings-Daten — nur durch Komplett-Re-Train zu beseitigen und das größte Bußgeld-Risiko.

Was bei Self-Trained-Modellen NICHT geht

Drei Garantien sind 2026 nicht erfüllbar: perfekte Löschung von Trainings-Daten (im Gradient nicht punktgenau entfernbar; Machine-Unlearning liefert nur Approximationen — also never train on PII), vollständige Anonymisierung von Embeddings (mit Inverter-Modellen rekonstruierbar) und 100-%-Prompt-Injection-Schutz. Die Architektur muss davon ausgehen, dass Injection durchkommt — ACL und Audit tragen auf Daten-Ebene, nicht auf Prompt-Ebene.

Einordnung für den GF-Tisch

Data-Exfiltration aus AI ist 2026 kein Theorie-Risiko, sondern ein operativer Audit-Bereich. Wer ein RAG-System produktiv betreibt, sollte halbjährliche Pentests mit AI-spezifischen Test-Cases einplanen — Prompt-Injection-Suite, Embedding-Inversion-Probe, ACL-Bypass-Tests. Art.-15-Auskunftsanfragen häufen sich seit Q4/2025 und sind ohne Audit-Logs strukturell nicht zu beantworten. Wer heute baut, plant Compliance-Architektur mit.

Praxis-Schritt: Ein 90-Min-Gespräch klärt, welche der drei Pfade offen sind und welcher Schutz-Layer den größten Compliance-Hebel liefert. Erstgespräch anfragen → /anfrage

Stand Mai 2026. Förderpfad-Beratung und Antragsbegleitung in Kooperation mit autorisierten Partner-Beratungen — eigene BAFA-/go-digital-Akkreditierung in Vorbereitung Q3 2026.

Baybora Gülec· Gründer, Azena

Nächster Schritt

Passt das auf Ihren Fall?

30-Min-Erstgespräch, kostenfrei und unverbindlich. Wir gehen Ihren konkreten Fall durch — und sagen ehrlich, wenn nichts passt.

Teilen LinkedIn Per E-Mail