Generative UI: Software, die ihre Oberfläche selbst baut

TL;DR

Die Oberfläche verschwindet nicht — sie verlagert sich. Zwei Versuche, das User-Interface abzuschaffen (KI-Geräte wie der Humane Pin; in jede App geschraubte Chat-Buttons), sind gescheitert — sie setzten dort an, wo klassische Bedienung längst gewinnt.
Die Wahl des Interfaces ist eine Normalverteilung, kein gleichmäßiger Verlauf. Das Einfache gehört zur direkten Manipulation, das sehr Komplexe zu Agenten — und der große, alltägliche Mittelteil ist das eigentliche Feld der Generative UI: Die Software baut die passende Ansicht im Moment.
Für Software-Teams ist das ein Handwerks-Bruch. Man zeichnet nicht mehr jeden Screen, sondern entwirft die Bausteine und die Regeln, aus denen die KI die Oberfläche zusammensetzt.
Für den Mittelstand heißt das nicht „Chatbot anflanschen". Der Hebel liegt im Urteil, welcher Modus wo gewinnt — und in einem Regel-System, das die eigene visuelle Sprache und Fach-Logik trägt.

Zwei gescheiterte Versprechen

Ein graues Rechteck fragt: „Was möchtest du tun?" — und verliert das Rennen gegen ein paar Buttons in einer App, die es seit 15 Jahren gibt. Die fortschrittlichste Technologie, die je gebaut wurde, braucht länger, um einen Kaffee zu bestellen, als drei Taps in der gewohnten Oberfläche.

Genau hier scheiterten die spektakulärsten Versuche, die Benutzeroberfläche zu ersetzen. Der Humane Pin sammelte 230 Millionen Dollar ein, um Screens abzuschaffen — und wurde einer der größten Tech-Flops überhaupt. Sprachassistenten, die das „Computing der Zukunft" sein sollten, sind heute meist ein besserer Lichtschalter und ein Küchen-Timer. Microsoft verbaut eine Copilot-Taste in jede Tastatur. Aber gute Produkte verbreiten sich von selbst — niemand musste eine Gmail-Taste in Ihre Tastatur zwingen.

Der Fehler war nicht die Technik. Es war das Ziel: Man drängte eine neue Bedienform auf Aufgaben, die grafische Oberflächen bereits hervorragend lösen. Einen Uber rufen, eine Nachricht schreiben, Kaffee bestellen — vertraute, habituelle Handgriffe. Schließen Sie die Augen und entsperren Sie Ihr Handy: Sie wissen blind, wo die App liegt. Dagegen kommt kein Chatfenster an.

Warum grafische Oberflächen überhaupt funktionieren

Machen Sie auf einem Foto eine Pinch-Geste. Es zoomt. Sie haben nicht „zoome auf 200 %" getippt — Sie haben das Bild selbst angefasst. Eine Datei in den Papierkorb ziehen: Sie beschreiben es nicht, Sie ziehen sie hinein. Das ist direkte Manipulation, und sie ist der Kern, der grafische Oberflächen seit 40 Jahren trägt.

Ihre Superkraft: Alles, was möglich ist, liegt sichtbar vor einem, bereit zum Anfassen. Man muss keine Befehle auswendig kennen — man öffnet ein Menü, und da sind sie. Solange das, was man bedient, auf einen Screen passt, ist das kaum zu schlagen.

Doch dann wächst die Komplexität. Mehr Optionen, mehr Schalter, mehr Ansichten. Erst kollabiert alles in Menüs, dann in Untermenüs, dann in Panels, dann in konfigurierbare Panels, die man über ein weiteres Menü ein- und ausblendet. So entstehen die einschüchternden Oberflächen professioneller Werkzeuge. Der Instagram-Story-Editor fühlt sich leicht an. After Effects fühlt sich bedrohlich an — weil es weit komplexer ist, als direkte Manipulation tragen kann.

Solange das, was man bedient, auf einen Screen passt, ist direkte Manipulation kaum zu schlagen. Genau dort, wo sie aufhört, fängt das Interessante an.

Das eigentliche Bild ist eine Glocke

Es ist verlockend, daraus einen einfachen Verlauf zu machen: einfache Aufgaben → Oberfläche, komplexe Aufgaben → Agent. Aber so sieht es nicht aus. Es ist eine Normalverteilung.

Die wenigsten Dinge, die wir täglich tun, sind „einen Timer stellen" — und die wenigsten sind „Analysen auf riesigen Datenbanken". Das meiste liegt in der Mitte: im Web etwas suchen, eine Präsentation schreiben, einen Flug buchen, E-Mails sichten. Die Ränder sind gelöst. Der Mittelteil ist das, worauf es ankommt — und genau dort fehlte bisher das passende Interface.

Die Verteilung der Interface-Modi

Was wir täglich mit Software tun, ist kein gleichmäßiger Verlauf von einfach zu komplex — es ist eine Normalverteilung. Die Ränder sind gelöst. Der große mittlere Bereich ist das eigentliche Feld der Generative UI.

Generative UI: die Oberfläche entsteht im Moment

Hier kommt der dritte Weg. Tippen Sie eine Suche, und das Ergebnis erscheint — nur dass diese Seite nicht geladen, sondern im Moment generiert wurde, passend zu dem, was Sie eingegeben haben. Fragen Sie eine KI nach Relativitätstheorie, und statt einer Textwand baut sie eine interaktive Visualisierung.

Das Neue daran ist nicht, dass man Apps mit KI bauen kann. Das Neue ist: Niemand hat diese Oberfläche vorab gebaut. Eine Maschine hat entschieden, dass eine grafische Oberfläche hier das beste Interface ist — und sie dann gebaut. Das nennt man Generative UI. Heute ist die Erzeugung noch spürbar langsam. Aber so wie eine Webseite früher eine Minute lud und heute selbstverständlich sofort da ist, wird auch das zur Sekundensache.

Drei Stufen

Generative UI kommt nicht auf einmal, sondern in drei Stufen — und je tiefer, desto stärker verschiebt sich die Arbeit vom Zeichnen zum Entwerfen von Regeln.

Drei Stufen — von der Visualisierung zum System

UI auf Zuruf

Statt einer Textwand baut die KI im Moment die passende Ansicht — eine Tabelle, ein Diagramm, einen Slider.

Vertraute UI mit generativen Bausteinen

Die gewohnte Oberfläche bleibt — aber einzelne Teile passen sich an, die so kein Designer je gezeichnet hat.

Die Regeln sind das Produkt

Das ganze Produkt ist generativ. Nicht die Screens, sondern die Regeln dahinter sind das, was man baut.

Generative UI kommt nicht auf einmal. Sie wächst in drei Stufen — und je tiefer, desto mehr verschiebt sich die Arbeit vom Zeichnen zum Entwerfen von Regeln.

Stufe zwei ist der interessante Sprung. Eine Flugsuche mit Datumswählern ist sinnvoll — schneller und genauer als jedes Diktat. Aber sobald die Anfrage eigenwillig wird („von Italien und Polen nach San Francisco, Zwischenstopp New York, Daten noch offen"), bricht das starre Raster. Stufe zwei behält die vertraute Oberfläche, lässt aber einzelne Teile generativ werden — etwa einen Slider, der Daten verschiebt und mit Farbe die teuersten Flüge zeigt; etwas, das kein Designer je direkt entworfen hat. Airbnb hat chat-basiertes Buchen wieder verworfen, weil es nicht das richtige Interface war — und baut nun Modelle gezielt für Generative UI.

Was sich für den Bau von Software verschiebt

Und hier ändert sich, wie Software überhaupt entsteht. Designer und Entwickler entscheiden nicht mehr, wo ein Button, eine Liste oder ein Layout sitzt. Sie entwerfen Regeln: den Baukasten — die Lego-Steine mit der eigenen visuellen Sprache — und die Logik, wann die KI welchen Stein nutzt. Wann eine Karte statt einer Liste, welche Layouts bevorzugt, welche Dichte. Das ist eine grundlegende Verschiebung im Handwerk.

Die eigentliche Verschiebung im Handwerk

Designer und Entwickler zeichnen nicht länger jeden Screen. Sie entwerfen die Bausteine und die Regeln, aus denen die KI die Oberfläche im Moment zusammensetzt — mit der eigenen visuellen Sprache.

Was das für den Mittelstand heißt

Die Versuchung ist, ein Chatfenster an das bestehende Produkt zu schrauben. Das ist genau der Versuch, der bereits gescheitert ist. Die bessere Frage ist pro Funktion: Welcher der drei Modi gewinnt hier?

Modus	Stark bei	Beispiel
Direkte Manipulation	einfach, habituell, visuell	Kaffee bestellen, ein Foto zoomen
Generative UI	dem mittleren Feld	Flug mit Sonderwunsch, Daten erkunden
Agentisch / Chat	komplex, repetitiv, im Hintergrund	Dateien sortieren, Belege zusammenführen

Der Wert liegt nicht im nächsten Button, sondern im Urteil, welcher Modus wo trägt — und in einem Regel-System, das die eigene Marke und Fach-Logik in Software gießt. Das ist Boutique-Handwerk, kein Tool-Kauf. Genau so denken wir bei azena Mandate: tief gebaut, nicht in der Breite — mehr unter KI-Beratung für den Mittelstand und der Perspektive zu agentischer KI.

Ein nüchterner Punkt zur Souveränität: Sobald Oberflächen im Moment generiert werden, sitzt ein Modell mitten in Ihrem Produkt-Kreislauf — nicht am Rand. Wo dieses Modell läuft und wohin die Daten fließen, wird damit zur Design-Frage, nicht zur Fußnote. Datenkontrolle und EU-Residenz sind dann kein Compliance-Anhängsel, sondern Teil der Architektur — eine Wahl, die man bewusst trifft.

Nicht UI gegen Chat gegen GenUI — sondern alle drei

Die Zukunft ist nicht „alles Oberfläche", nicht „alles Chatbot" und nicht „alles generativ". Sie ist alle drei — jede dort, wo sie das Problem am besten löst. Klassische UI mit direkter Manipulation für das Einfache. Agentische Systeme für das Komplexe im Hintergrund. Und Generative UI für das große mittlere Feld dazwischen.

So wie das Xerox PARC vor 40 Jahren die grafische Oberfläche erfand und damit prägte, wie wir Technik bedienen, passiert das gerade noch einmal. Wer Software baut, sollte nicht auf den einen Sieger warten, sondern lernen, die drei Modi mit Geschmack zu komponieren.

Wenn ihr eure Software für dieses Bild aufstellen wollt — welcher Modus wo, und welches Regel-System darunter — sprecht mit uns.

Inspiriert von Enrico Tartarottis Essay „The Weird Future of User Interfaces" (2026). Eigene Einordnung, herstellerneutral. Stand: Mitte 2026.

Baybora Gülec· Gründer, Azena

Nächster Schritt

Passt das auf Ihren Fall?

30-Min-Erstgespräch, kostenfrei und unverbindlich. Wir gehen Ihren konkreten Fall durch — und sagen ehrlich, wenn nichts passt.

Erstgespräch buchen

Teilen LinkedIn Per E-Mail