Alle Beiträge

Produktion & Supply-Chain

Vertrag-RAG: Lieferanten-Verträge, AGB, NDA-Vergleich

Vertrag-RAG holt Senior-Juristen-Stunden zurück, indem KI Lieferanten-AGB, NDAs und Risiken liest — wenn Citation-Zwang und Review-Pflicht stehen.

Azena Editorial17. Mai 20269 Min.

TL;DR

  • Vertrag-RAG hebt 3–5 Senior-Juristen-Stunden pro Woche — über AGB-Konflikt-Detection, NDA-Klausel-Vergleich, Werkvertrag-Risk-Scoring und DSGVO-AVV-Mapping.
  • Vier Use-Cases tragen 2026 produktiv: Lieferanten-AGB gegen eigene AGB, NDA gegen Standard-Template, Werkvertrag-Haftungs-Scoring, Art.-28-DSGVO-Auftragsverarbeitungs-Check.
  • Citation-Constraint ist nicht optional, sondern Architektur-Gate. Ohne forced citation und Reviewer-Pflicht halluziniert das System Klauseln, die so nicht im Vertrag stehen.

Warum Verträge der höchste Value-pro-Dokument sind

Verträge sind das einzige Dokument im Mittelstand, das gleichzeitig hochstrukturiert und unverhandelbar individuell ist. Jede Klausel hat juristisches Gewicht, jede Formulierung ist im Streitfall auditierbar — genau das macht sie zum idealen RAG-Anwendungsfall.

Der Hebel sitzt nicht bei Massen-Verträgen, sondern bei der Senior-Juristen-Stunde. Jede Stunde, die ein Justiziar nicht mit AGB-Abgleich verbringt, ist hart kalkulierbarer Wert. In DACH-Pilots zeigt sich das Muster: ein Backlog von Wochen schrumpft auf wenige Tage, weil Junior-Reviews eine konsistente Vor-Klassifikation bekommen — bei gleicher Qualität.

Vier Use-Cases mit echtem ROI

Lieferanten-AGB vs. eigene AGB. Jede Lieferanten-AGB enthält drei bis sieben Klauseln, die der eigenen Einkaufs-AGB widersprechen: Eigentumsvorbehalt, Gerichtsstand, Gewährleistungs-Fristen, Haftungs-Caps, Zahlungs-Ziel, Erfüllungs-Ort. RAG erkennt Konflikte in 90 Sekunden statt 25–40 Minuten Senior-Lesezeit.

NDA gegen Standard-Template. Inbound-NDAs weichen in 4–8 Punkten ab — Geheimhaltungs-Dauer, anwendbares Recht, Rückgabe-Pflicht, restriktive Wirkung, Vertragsstrafe. RAG produziert ein Delta-Cockpit gegen das Template: 5–8 Minuten statt 30–45. Der Justiziar entscheidet nur noch über die 2–3 strittigen Klauseln.

Werkvertrag-Risk-Scoring. Risk-Treiber sind Haftungsklauseln (Cap, Freistellung, Mit-Verschulden), Gerichtsstand, Versicherungs-Deckungssumme, Subunternehmer-Klausel und Force-Majeure-Breite. RAG liefert einen Risk-Score 0–100 mit ranked Findings in unter 2 Minuten statt 60–90 Minuten Tiefen-Review.

DSGVO-Art.-28-AVV-Mapping. Auftragsverarbeitungs-Verträge müssen acht Pflicht-Inhalte abdecken: Gegenstand, Dauer, Art und Zweck, Datenarten, Kategorien Betroffener, Pflichten/Rechte, TOMs, Sub-Auftragsverarbeiter. RAG liefert den Gap-Report in unter 3 Minuten statt 20–30 Minuten Checklisten-Abgleich.

Architektur-Pattern

Das produktive Setup hat fünf Stages, jede mit eigenem Qualitäts-Gate. Keine darf übersprungen werden.

StageVerfahrenOutput
1. PDF-ExtractionOCR (Tesseract/Azure) + Layout-ParserStrukturierter Text mit Layout-Metadaten
2. Klausel-SegmentationRegex + LLM-Segmentation, Klausel-Klassifikator50–150 typisierte Klauseln pro Vertrag
3. EmbeddingGerman-BERT / jina-v3 / mxbai-largeVektor pro Klausel
4. Hybrid-SearchBM25 + Vector + Re-RankerTop-10 Klauseln + Reference-Klausel
5. Generation + CitationLLM mit forced citation, structured outputDelta-Bericht mit Klausel-Verweis

Die kritische Stage ist die Klausel-Segmentation. Wer hier einen Volltext-Chunk macht statt sauberer Klausel-Grenzen, verliert die juristische Trennschärfe — Embedding einer halben Klausel produziert halbe Antworten.

Embedding-Modelle für Deutsch

ModellDE-QualiMehrsprachigOn-Prem
German-BERTSehr starkNeinJa
jina-embeddings-v3StarkJa (89 Sprachen)Ja
mxbai-embed-largeStarkEN-stark, DE-gutJa
e5-multilingual-largeGutJa (100+ Sprachen)Ja

German-BERT für rein deutschsprachige Mandate mit Datenschutz-Forderung. jina-v3, wenn deutsche und englische Verträge gemischt werden — im DACH-Mittelstand mit US-Kunden Standard. mxbai-large als pragmatischer Self-Host-Default mit Re-Ranker obendrauf.

Was Senior-Juristen NICHT delegieren dürfen

  • Verhandlung. Die KI produziert die Vor-Klassifikation, der Justiziar führt das Gespräch. Tonfall, Eskalations-Strategie und Konzession-Logik sind menschliche Entscheidungen.
  • Risiko-Bewertung. Ein Risk-Score von 78 bedeutet nicht «ablehnen», sondern «Senior-Review nötig». Die Geschäftskontext-Einbettung macht der Mensch.
  • Vergleichs-Beurteilung. Abweichung ist nicht gleich Risiko — manchmal ist die Lieferanten-Klausel besser als das eigene Template.

Was Halluzinations-Risiko killt

Vertrag-RAG hat höheres Halluzinations-Risiko als andere Domänen, weil das LLM plausible Klauseln erfinden kann, die juristisch nicht im Vertrag stehen. Zwei harte Constraints sind Pflicht.

Erstens der Citation-Constraint: Jede Aussage muss auf eine konkrete Klausel-ID mit Seiten- und Absatz-Referenz zurückgeführt werden. Forced-citation-Output mit Pflicht-Feld source_clause_id ist Architektur-Gate, nicht Convenience.

Zweitens die Reviewer-Pflicht: Kein Sign-off ohne Senior-Juristen-Review. Audit-Logs müssen den Human-in-the-Loop-Schritt dokumentieren — für DSGVO Art. 22 wie für die anwaltliche Sorgfaltspflicht. Wer beide Constraints aufweicht, diskutiert in sechs Monaten die erste «interpretierte» Klausel im Schadensfall vor Gericht.

Einordnung für den GF-Tisch

Vertrag-RAG ist 2026 der höchste Value-pro-Dokument-Use-Case im Mittelstand, gemessen an Senior-Stunden-Lift pro investiertem Euro. Voraussetzung: ein Legal-Team, das die Auto-Vorlagen ernst nimmt und die KI nicht als Anwaltsersatz missbraucht. Setup-Aufwand liegt bei 8–14 Wochen mit klar definierbarem Festpreis-Rahmen, der Investitionsaufwand amortisiert sich typisch im ersten Jahr.

Praxis-Schritt: Ein 30-Min-Eignungsgespräch klärt, ob Vertrag-RAG für Ihren Vertrags-Mix trägt und welcher der vier Use-Cases den größten Erst-Hebel liefert. Erstgespräch anfragen → /anfrage

Stand Mai 2026. Förderpfad-Beratung und Antragsbegleitung in Kooperation mit autorisierten Partner-Beratungen — eigene BAFA-/go-digital-Akkreditierung in Vorbereitung Q3 2026.

Azena Editorial· AI-Tech-Beobachtung

Nächster Schritt

Passt das auf Ihren Fall?

30-Min-Erstgespräch, kostenfrei und unverbindlich. Wir gehen Ihren konkreten Fall durch — und sagen ehrlich, wenn nichts passt.

Teilen LinkedIn Per E-Mail