Ticket-Routing: Wo der MSP-Hebel sitzt

TL;DR

L1-Auto-Resolution-Pitches versprechen 50–70 % Deflection; real sind 15–25 % (Password-Reset, Lizenz-Reaktivierung, Standard-FAQ).
Der echte Hebel sitzt in L2-Routing + Kontext-Bundle: Asset-Lookup, Ticket-Match und Lösungs-Vorschlag reduzieren die Mean-Time-to-Engineer um 60–70 %.
Bei mittlerer MSP-Last sind die 8–12 Min/Ticket × Volume der größere ROI-Block als jede Auto-Resolution.

Warum L1-Auto-Resolution falsch verkauft wird

Der Pitch fast aller KI-Vendor-Plugins für ServiceNow, Jira Service Management, OTRS und Zammad lautet: „Wir schließen 50 % Ihrer L1-Tickets autonom." In der Mittelstands-MSP-Realität liegt die nachweisbare Deflection bei 15–25 % — gut für Password-Reset, Lizenz-Reaktivierung, MFA-Resync und Standard-FAQ. Alles darüber kollidiert mit Asset-Spezifika, Lizenz-Konstellationen und Ausnahmen.

Das Problem ist die Pitch-Mechanik: Auto-Resolution ist als Wirkung sichtbar (Ticket geschlossen), Routing-Beschleunigung verschwindet in der Bearbeitungs-Statistik.

Use Case	Deflection	Voraussetzung
Password-Reset (AD/Entra)	60–80 %	SSO, Self-Service-Portal
Lizenz-Reaktivierung (M365, Adobe)	40–60 %	API-Zugriff auf Tenant
MFA-Resync	30–50 %	Identity-Provider angebunden
Standard-FAQ (Drucker, VPN)	20–35 %	Knowledge-Base aktuell
Komplexe Incidents (≥ L2)	< 5 %	—
Gewichteter Schnitt	15–25 %	reale Mischung

Wer 50 % verspricht, rechnet eine reine L1-Sub-Population oder schließt Tickets, die nie hätten geöffnet werden sollen — „Self-Service-Hygiene", kein KI-Effekt.

Der echte Hebel: Routing + Kontext-Bundle

Das durchschnittliche MSP-Ticket verbrennt 8–12 Minuten Engineer-Zeit, bevor die eigentliche Arbeit anfängt: Kunde identifizieren, Asset zuordnen, Lizenz-Status prüfen, Verlauf scannen, ähnliche Fälle suchen, Engineer routen. Diese Minuten sind automatisierbar — ohne dass die KI eine Entscheidung trifft. Sie bundlet nur Kontext, den der Mensch sonst manuell zusammensucht:

Workflow-Diagramm Ticket-Klassifikation und Kontext-Bundle-Pipeline — Exhibit 2: 6-Schritt-Pipeline — 8–12 Sekunden statt 8–12 Minuten.

Asset-CMDB-Lookup. Aus Absender-Mail oder Subject zieht der Assistent Device, OS, Software, Lizenz-Status, Garantie und Wartungsstand. In IT-Glue, Hudu oder ServiceNow-CMDB liegt das strukturiert vor — wird aber nicht aufgerufen, weil der Lookup vier Klicks kostet.
Vergangenheits-Ticket-Match. Vektorsuche über 12–24 Monate gelöster Tickets liefert die drei ähnlichsten Fälle inklusive Lösungsweg — bei 100 k+ Tickets die größte ungehobene Wissens-Reserve im Haus.
Lösungs-Vorschlag mit Konfidenz. Bei klaren Patterns (gleiches Asset, Symptom, Fix) liefert der Assistent einen Vorschlag mit Konfidenz-Score. Der Engineer akzeptiert, lehnt ab oder modifiziert — die Recherche entfällt.

In MSP-Pilots zeigt sich: Die KI muss nicht die Tickets lösen. Sie muss die Lücke zwischen Ticket-Eingang und der ersten produktiven Engineer-Minute schließen — und das ist der Großteil der heutigen Bearbeitungszeit.

Wie der Assistent arbeitet

Der Workflow ist deterministisch — die KI sitzt nur an den drei Stellen, an denen Semantik-Verständnis nötig ist:

MSP-Engineer am Multi-Monitor-Setup mit ServiceNow und CMDB — Exhibit 3: Pilot-Cockpit nach 90 Tagen — Mean-Time-to-Engineer von 11,4 auf 3,8 Min.

Klassifikation (LLM, Haiku-Klasse): Ticket-Typ, Kunde, Asset-Hinweis aus dem Mail-Body.
CMDB-Lookup (deterministisch, API): Asset, Lizenzen, Garantie, Wartungsstand.
Historien-Match (Vektorsuche + LLM): drei ähnlichste gelöste Tickets, Relevanz-Ranking.
Routing-Vorschlag (Regel-Engine): L1/L2/L3-Gruppe und spezifischer Engineer.
Kontext-Bundle (Template): strukturierte Ticket-Notiz im PSA-Tool, die der Engineer übernimmt.

Gesamtzeit: 8–12 Sekunden vom Eingang bis zum vollständig kontextualisierten Ticket auf dem Schreibtisch des richtigen Engineers. Heute verbrennt derselbe Schritt 8–12 Minuten — ein Faktor 60–80.

MSP-Pilot: 280 MA, 14.000 Tickets/Monat

Pilot-Implementierung Q1/2026 bei einem süddeutschen MSP mit 280 Mitarbeitenden und 14.000 Tickets/Monat. Toolchain: ServiceNow, IT-Glue als CMDB, Pinecone-Vektor-Store, LLM-Calls über Nexus Router.

Kennzahl	Vor Pilot	Nach 90 Tagen	Delta
Mean-Time-to-Engineer	11,4 Min	3,8 Min	–67 %
First-Touch-Resolution-Rate	38 %	51 %	+13 pp
Tickets/Engineer/Tag	18	26	+44 %
L1-Auto-Resolution-Quote	12 %	21 %	+9 pp
Engineer-NPS (intern)	+12	+41	+29
Engineer-Kapazität (annualisiert)	—	+9 FTE	freigesetzt

Der größte Effekt ist nicht die Auto-Resolution (+9 pp), sondern die Mean-Time-to-Engineer (–67 %) — 9 FTE Kapazitäts-Gewinn aus 280, ohne Hire, ohne Outsourcing. Die NPS-Bewegung von +12 auf +41 ist der unterschätzte Nebeneffekt: bei 18–25 % Engineer-Fluktuation rechnerisch der zweite ROI-Block.

Was bleibt menschlich

Eskalations-Entscheidung. Wann ein Ticket an L3 oder zum Vendor eskaliert, bleibt Engineer-Urteil. Der Assistent liefert Daten, nicht die Entscheidung.
Kundenkommunikation bei Eskalation. Sobald ein Incident die SLA-Grenze touchiert oder sensibel wird, übernimmt der Service-Manager. Templates ja — Versand niemals autonom.
Knowledge-Base-Pflege. Erkennt der Assistent systematisch dieselben Patterns nicht, ist das ein Hinweis auf eine Wissens-Lücke und bleibt Senior-Arbeit.

Einordnung

Der Hebel ist nicht die KI-Magie, sondern die kalte Mathematik: 14.000 Tickets × 8 Minuten gesparte Vorbereitung ergeben rund 1.870 Engineer-Stunden pro Monat. An dieser Zahl misst jeder MSP-Geschäftsführer das Projekt. Das Routing-Bundle baut sich aus den Bestandsdaten des Hauses — CMDB, Historie, Lizenz-Stamm. Wer die Daten nicht bundlet, kauft Vendor-Magie und bekommt 15 % Deflection.

Stand Mai 2026.

Azena Editorial· IT-Service-Provider

Nächster Schritt

Passt das auf Ihren Fall?

30-Min-Erstgespräch, kostenfrei und unverbindlich. Wir gehen Ihren konkreten Fall durch — und sagen ehrlich, wenn nichts passt.

Erstgespräch buchen

Teilen LinkedIn Per E-Mail