Decagon: agentic AI im B2B-Support

TL;DR

Decagon meldet bei US-Kunden wie Bloomberg, Eventbrite und Modern Treasury 50–80 % L1/L2-Ticket-Deflection — die obere Spanne gilt für SaaS-Standard-Flows, nicht für regulierte Anliegen.
Die Architektur-Innovation heißt Agent Operating Procedures (AOPs): deterministisch durchsetzbare Prozeduren statt freier LLM-Konversation — das Sicherheits-Pattern, das 2026 zum Mittelstands-Default wird.
Für den DACH-Mittelstand ist Decagon selbst zu früh (EN-first, Enterprise-Pricing); die Architektur ist aber direkt für Eigen-Builds übertragbar, 30–50 % Cost-Reduktion sind realistisch.

Was Decagon anders macht: AOPs statt freier Konversation

Decagon hat 2025 eine große Series C geschlossen (Lead: Bond Capital, Co-Investoren u. a. Andreessen Horowitz, Accel). Kundenliste: Bloomberg, Eventbrite, Modern Treasury, Notion, Substack, Duolingo. Pitch in einem Satz: agentic AI ersetzt 50–80 % des L1/L2-Customer-Service-Volumens, mit deterministischer Eskalation in den menschlichen Tier-3.

Die Kernidee unterscheidet sich systematisch von der ersten Welle der LLM-Chatbots. Agent Operating Procedures sind explizit kodierte Prozeduren — »wenn Refund-Anfrage und Bestellung jünger als 30 Tage und Betrag unter Bagatell-Grenze, dann Pfad A; sonst eskaliere mit Kontext-Bundle« — die der Agent nicht umgehen kann. Das LLM sitzt für Sprach-Verständnis, Intent-Klassifikation und natürliche Formulierung; die Entscheidungs-Logik bleibt deterministisch.

Das ist das Gegenteil der Demo-Logik, in der ein Free-Form-Agent »reasonen« und Tools frei wählen darf. AOPs schließen den Halluzinations-Pfad systematisch, weil der Agent strukturell nicht außerhalb der definierten Prozedur antworten kann.

Dimension	Klassischer LLM-Chatbot (2023–24)	Decagon-AOP-Architektur (2025–26)
Entscheidungs-Logik	LLM frei	Deterministische Prozedur
Tool-Use	Agent wählt	AOP definiert, Agent ruft auf
Eskalations-Pfad	Heuristisch	Hart kodiert
Halluzinations-Risiko	Hoch	Strukturell unterbunden
Audit-Trail	Lückenhaft	Pro Step protokolliert
Deflection-Rate (real)	15–25 %	50–80 % (SaaS-Standard)
Compliance-Tauglichkeit	Niedrig	EU AI Act Art. 9-fähig

In Production-Settings zeigt sich konsistent: Der Bruch zwischen 25 % und 70 % Deflection sitzt nicht im Modell — er sitzt in der Prozedur-Disziplin.

Wer Decagon einsetzt, wer nicht

Die Kundenliste verrät die ICP-Logik präzise: hohes Ticket-Volumen, standardisierte Anliegen, EN-first, SaaS-Operating-Model.

SaaS-Plattformen. Notion, Substack, Duolingo — Millionen-User-Bases mit repetitiven Account-, Billing- und Feature-Anfragen. Deflection-Quoten von 70–80 % sind hier nachweisbar, weil 90 % der Tickets in einem Set aus 30–50 wiederkehrenden Intents liegen.
Fintech. Modern Treasury zeigt den Pfad: strukturierte Daten plus klare Eskalations-Pfade bei Compliance-relevanten Anliegen. Die AOP-Logik passt hier strukturell besser als freie Konversation.
Marketplaces. Eventbrite verarbeitet Refund-, Ticket-Transfer- und Veranstalter-Anfragen im sechsstelligen Tagesbereich. AOPs decken die Standard-Flows ab, der menschliche L3 sitzt nur auf den 5–10 % strittiger Fälle.

Nicht für regulierten DACH-Mittelstand (aktuell): Versicherungs-Schadens-Bearbeitung, MedTech-Beratungs-Hotlines, B2B-Maschinen-Support mit Sicherheits-Implikationen. Gründe: EN-first (DE-Support in Pilot-Phase), Enterprise-Pricing und ein Standard-AOP-Template-Set, das regulierte Branchen nicht abdeckt. Mittelständler mit schmalem Service-Budget bauen günstiger selbst.

Architektur-Pattern für Mittelstand-Eigen-Build

Wer die Decagon-Idee 2026 im DACH-Mittelstand bauen will, kopiert nicht das Produkt — sondern die Architektur. Der Stack lässt sich aus Open-Source- und DSGVO-konformen Komponenten zusammensetzen.

Layer	Komponente	Funktion
Intake	Zendesk/Freshdesk/HubSpot-Webhook	Ticket-Eingang, Kanal-Normalisierung
Intent-Klassifikation	LLM (Haiku/Sonnet/Mistral)	Intent + Konfidenz + Sprache
AOP-Engine	Deterministischer Rule-Runner	Prozedur-Auswahl, Step-Sequencing
Tool-Layer	API-Wrapper für CRM, Billing, CMDB	Datenzugriff, Status-Updates
Response-Gen	LLM mit Template + RAG	Natürliche, mehrsprachige Formulierung
Eskalations-Bundle	Strukturierter Kontext-Dump	Mensch übernimmt mit vollem Kontext
Audit-Log	Event-Store (Postgres, Supabase)	Pro Step: Input, Output, Decision, Latency

Aufbau-Zeit: 8–14 Wochen für einen Pilot mit 5–10 AOPs, ein Senior-Architect plus ein Backend-Engineer. Die teure Komponente ist nicht das LLM, sondern die Prozedur-Definition mit dem Service-Lead — rund 60 % der Pilot-Zeit gehen ins Mapping bestehender Anliegen-Patterns auf AOPs.

Was 2026 NICHT funktioniert

AOP-Agents sind kein Universal-Hebel. Drei Domänen, in denen Free-Form-LLM und AOP gleichermaßen scheitern:

Regulierte Beratung mit Haftungs-Implikation. MedTech-Anwender-Support, pharmazeutische Aufklärung, Anlage-Beratung. Die dokumentierte Fach-Qualifikation der antwortenden Person ist juristisch nicht durch ein LLM ersetzbar — auch nicht mit AOP-Disziplin. Hier sitzt die KI vor dem menschlichen Agent als Kontext-Bundler, nicht statt seiner.
Tarif-Verhandlung und individuelle Kulanz. Wann ein Anbieter Rabatt einräumt oder ein Versicherer auf einen Selbstbehalt verzichtet, ist eine kommerzielle Entscheidung mit Verhandlungsdynamik. AOPs können Standard-Kulanzen unter Bagatell-Grenzen automatisieren; die echten Verhandlungen bleiben menschlich.
Schadens-Eskalation mit politischer oder PR-Dimension. Ein Kunde droht öffentlich, eine Beschwerde adressiert das C-Level, ein Vorfall berührt Datenschutz-Behörden. Die Eskalations-Erkennung kann automatisiert werden — die Antwort muss menschlich bleiben.

Einordnung

Der Markt hat sich 2025–26 entlang einer klaren Trennlinie sortiert: Free-Form-Agents (frühe OpenAI-Demos) gegen AOP-Disziplin (Decagon, Cresta, Forethought in Teilen). Die Daten der ersten Welle Enterprise-Pilots zeigen einen reproduzierbaren Befund — strukturierte Prozeduren liefern in Production-Settings 2–3× höhere Deflection als freie Agent-Reasoning-Loops.

Für den DACH-Mittelstand ist die Lektion nicht »kauft Decagon«, sondern »kopiert die Architektur«. Wer 2026 einen Customer-Service-Agent ohne explizite AOP-Disziplin baut, baut die Halluzinations-Falle der 2023er-Welle nach. Mit AOPs sind 30–50 % Cost-Reduktion im Service-Operating-Budget realistisch — bei 90-Tage-Pilot-Zyklen.

Praxis-Schritt: Ein 30-Min-Eignungsgespräch klärt, ob Ihre Ticket-Mischung AOP-fähig ist — und welcher Hybrid-Pfad (Eigen-Build, Intercom-Wrapper, Decagon-Enterprise) zu Ihrer Volumen-Logik passt. Erstgespräch anfragen → /anfrage

Stand Mai 2026. Decagon und die Konkurrenz-Landschaft (Sierra, Cresta, Forethought, Intercom Fin AI) verschieben sich monatlich — diese Übersicht wird entsprechend aktualisiert.

Azena Editorial· AI-Tech-Beobachtung

Nächster Schritt

Passt das auf Ihren Fall?

30-Min-Erstgespräch, kostenfrei und unverbindlich. Wir gehen Ihren konkreten Fall durch — und sagen ehrlich, wenn nichts passt.

Erstgespräch buchen

Teilen LinkedIn Per E-Mail