TL;DR
- Drei Capability-Pattern 2026: internes AI-Team, externe AI-Beratung, Hybrid — jedes mit eigener Cost-, Speed- und Risiko-Logik.
- Hybrid gewinnt im Mittelstand: 1–2 interne Senior plus Beratung für 3–4 jährliche Builds liefert Geschwindigkeit, Tiefe und kontrollierbares Risiko.
- Fünf Entscheidungs-Kriterien: Build-Pipeline-Volume, Domain-Spezifizität, Geschwindigkeit, Risiko-Verteilung, Knowhow-Lock-In.
Drei Pattern im Vergleich
AI-Capability entsteht 2026 nicht über Nacht und nicht in einem einzigen Bezugs-Modell. Drei Pattern dominieren den DACH-Mittelstand — jedes mit eigener Logik aus Kosten, Geschwindigkeit, Tiefe und Risiko.
| Pattern | Speed (Time-to-Build) | Domain-Tiefe | Risiko-Profil |
|---|---|---|---|
| Internes AI-Team | 6–9 Monate Ramp-up | Sehr hoch (Lock-In im Haus) | Hiring-Risiko, Plateau-Risiko |
| Externe Beratung | 4–8 Wochen pro Build | Mittel (Beratung-Knowhow) | Knowhow-Lock-Out, Vendor-Risiko |
| Hybrid | 2–4 Wochen pro Build (parallel) | Hoch (intern + Beratung) | Geteiltes Risiko, Übergabe-Risiko |
- Internes Team: 1–3 AI-Engineers plus 1 AI-Translator-Lead. Lohnt sich ab >2 Builds/Jahr und sehr spezifischer Domain.
- Externe Beratung: Projekt-Engagements plus optionalem Skalierungs-Retainer. Schneller als jedes Hiring, aber Wissen verschwindet ohne explizite Übergabe-Pflicht. Lohnt sich bei <2 Builds/Jahr und akuten Initiativen.
- Hybrid: kleines internes Team (1–2 Senior) plus Beratung für Spitzen — das häufigste Pattern im Mittelstand und 2026 die Default-Empfehlung.
In DACH-Mandaten zeigt sich: Wer AI-Capability für ein reines Hiring-Problem oder ein reines Einkaufs-Problem hält, verbrennt 12 Monate.
Fünf Entscheidungs-Kriterien
Die Pattern-Wahl folgt fünf Kriterien — nicht dem Bauchgefühl der Geschäftsführung und nicht dem Hiring-Drang des IT-Leiters. Jedes hat eine klare Schwelle, jenseits derer ein Pattern die anderen schlägt.

- Volume — >2 AI-Builds pro Jahr = internes Team rentabel. Unter dieser Schwelle frisst die Beraterquote den Salary-Vorteil, über ihr skaliert internes Team günstiger als jede Beratung.
- Spezifizität — sehr spezifische Domain schlägt jede Beratung. Eine Steuerberatungs-Kanzlei mit 20 Jahren Mandanten-Daten baut intern besser als jede externe Boutique. Domain-Tiefe ist 2026 der härtere Moat als Code-Qualität.
- Speed — akute Initiative = Beratung schneller als 9-Monats-Hiring. Wer in Q3 einen produktiven Use-Case braucht, kann nicht auf einen Senior-Hire bis Q1 warten. Beratung liefert in 4–8 Wochen.
- Risiko — Beratung trägt Festpreis-Risiko (Budget-Überschreitung auf eigene Rechnung), internes Team trägt das Wrong-Hire-Risiko im Senior-AI-Segment.
- Lock-In — ohne Übergabe-Klausel verschwindet 60–80 % des Build-Wissens mit dem Engagement-Ende. Mit Übergabe-Pflicht bleibt das Wissen im Haus, und der Build lässt sich später selbst weiterentwickeln.
Hybrid-Setup im Detail
Der Hybrid ist 2026 nicht "Beratung plus ein bisschen intern" — es ist eine bewusste Arbeitsteilung mit klarer Übergabe-Pflicht. Jede Rolle hat einen Owner, jede Übergabe einen Vertrag.

| Rolle intern | Rolle Beratung | Übergabe-Pflicht |
|---|---|---|
| AI-Translator-Lead (Domain + Business) | Senior-Architect (Pattern, Stack-Wahl) | Architecture-Decision-Records, versioniert |
| AI-Engineer Junior/Mid | AI-Engineer Senior (Pair-Programming) | Git-Repo + README + Runbook |
| Domain-SME (Fach-Lead) | Eval-Engineer (RAGAS, Quality-Gates) | Eval-Set + Quality-Baseline |
| Compliance-Owner (DSGVO, AI Act) | Compliance-Berater (DPIA, Risk Register) | DPIA-Dokument + Risk Register |
| Ops-Lead (Monitoring, Cost-Caps) | Platform-Architect (CI/CD, Observability) | Runbook + Cost-Dashboard + Alert-Setup |
Intern dominiert Domain und Business-Owner-Rolle, Beratung dominiert Technik-Tiefe und Cross-Industry-Knowhow. Pair-Programming ist nicht optional — es ist die Lock-In-Brechstange.
Pilot: Steuerberatungs-Kanzlei, Hybrid über 4 Quartale
Ein mittelständischer Steuerberater (180 MA) baute über vier Quartale eine Hybrid-Capability mit drei produktiven Use-Cases — ohne den Aufbau eines Senior-AI-Teams von null auf drei in 9 Monaten zu erzwingen.
| Quartal | Schritte | Findings |
|---|---|---|
| Q1 | Beratung baut Build 1 (Belegerfassung), Pair mit internem Junior | 8 Wochen Time-to-Production, 92 % OCR-Accuracy |
| Q2 | Beratung baut Build 2 (Bilanz-Analyse), Junior wird Mid, Übergabe Build 1 | 6 Wochen Time-to-Production, interner Mid übernimmt Maintenance |
| Q3 | Internes Team baut Build 3 (Mandanten-Chatbot) allein | 10 Wochen, erste vollständig interne Auslieferung |
| Q4 | Drei Builds in Production, Beratung nur noch für Audit + Eval | 3 Use-Cases live, ROI-Break-Even nach 11 Monaten |
Die Hybrid-Variante lieferte ab Q3 eine eigenständige Capability. Reine Beratung hätte vergleichbar viel gekostet — aber ohne interne Capability; reines Internal hätte 12–15 Monate länger gedauert.
Anti-Patterns
- Pure-Beratung ohne Lead — Wissen verschwindet mit Engagement-Ende. Ohne internen Translator-Lead versteht niemand die Architecture-Decisions, und Build 2 ist wieder ein Greenfield-Engagement.
- Pure-Internes-Team ohne Mentoring — Plateau bei "wie machen wir das produktiv?". Ein interner Engineer ohne Cross-Industry-Knowhow baut Prototypen, aber Production-Hardening (Eval, Monitoring, Cost-Caps) bleibt aus. Senior-Architect-Retainer ist die Brücke.
- Beratung ohne Übergabe-Pflicht — Knowhow-Lock-Out im Vertrag. Ohne explizite Klausel für ADRs, Runbooks, Eval-Sets und Pair-Programming bleibt das Build-Wissen bei der Beratung, und der nächste Build startet bei null.
Default-Empfehlung 2026
Der Build-vs-Buy-Entscheid 2026 ist umsatz- und volume-getrieben, nicht ideologisch.
- Hybrid im Mittelstand: Default-Pattern. 1–2 interne Senior plus Beratung für 3–4 jährliche Builds. Geschwindigkeit, Tiefe und kontrollierbares Risiko bei akzeptabler Capex-Last.
- Intern dominant bei großem Mittelstand: Build-Pipeline rechtfertigt 3–6 interne AI-Engineers plus Translator-Lead. Beratung nur noch für Spezial-Spitzen (Architecture-Review, Compliance-Audit, neue Modalitäten wie Vision oder Voice).
- Pure Beratung nur bei kleinem Umsatz oder einzelnen Use-Cases: internes Team rechnet sich nicht. Beratung mit harter Übergabe-Pflicht und Maintenance-Retainer ist die saubere Wahl.
Praxis-Schritt: Ein 90-Min-Build-vs-Buy-Assessment prüft Pipeline-Volume, Domain-Spezifizität, Hiring-Risiko und Übergabe-Anforderungen — und liefert die Pattern-Empfehlung für 12 Monate. Erstgespräch anfragen → /anfrage
Stand Mai 2026. AI-Build-Engagements mit harter Übergabe-Pflicht (ADRs, Runbooks, Eval-Sets, Pair-Programming) sind Azena-Default — eigene BAFA-/go-digital-Akkreditierung in Vorbereitung Q3 2026.
Nächster Schritt
Passt das auf Ihren Fall?
30-Min-Erstgespräch, kostenfrei und unverbindlich. Wir gehen Ihren konkreten Fall durch — und sagen ehrlich, wenn nichts passt.
