Die Unternehmen, die 2023 und 2024 am lautesten über KI geredet haben, liegen 2026 nicht vorne. Die, die vorne liegen, kennen Sie nicht. Sie haben keine Ankündigungen über den KI-Ersatz von Mitarbeitenden gemacht. Sie haben keine Transformationsstudien veröffentlicht. Sie betreiben KI in der Produktion, messen, was nicht funktioniert, und beheben es, bevor es sichtbar wird.
Die Unternehmen, die am lautesten ankündigten — Klarnas 700 ersetzte Support-Agenten, Duolingos Schwenk zu KI-first, CNETs KI-generierte Redaktionsinhalte — haben heute andere Probleme: sinkende Zufriedenheitswerte, Markenschäden, redaktionelle Korrekturen und den Reputationsschaden, von öffentlichen Versprechen abrücken zu müssen. Die Ankündigung war die Strategie. Die Strategie hat nicht gehalten.
Der Markt spaltet sich entlang einer Linie: Unternehmen, die die operative Kontrolle über das Eingesetzte behielten, versus Unternehmen, die den KI-Einsatz als Kommunikationsereignis behandelten. Der Abstand zwischen diesen beiden Gruppen wächst.
Was es heißt, den Überblick zu verlieren
Man verliert den KI-Überblick nicht auf einen Schlag. Es geschieht als Abfolge kleiner, unsichtbarer Probleme, die sich zu einem messbaren summieren.
Klarnas KI-Chatbot wickelte im ersten Monat zwei Drittel aller Kundenservice-Gespräche ab — 2,3 Millionen Chats. Die durchschnittliche Bearbeitungszeit sank von 11 auf 2 Minuten. Die Zahlen stimmten. Die vergessene Variable: Durchschnittliche Leistung über alle Anfragentypen ist nicht die Kennzahl, die über Kundenbindung entscheidet. Häufige, unkomplizierte Anfragen — Bestellstatus, FAQ, Rücksendungen — funktionierten gut. Abrechnungsstreitigkeiten und Betrugsmeldungen nicht. Klarna hat das Volumen gemessen. Nicht die Kosten je Anfragentyp.
Ingenieure bei Samsung nutzten ChatGPT für interne Code-Reviews und luden dabei versehentlich proprietären Halbleiter-Quellcode auf OpenAI-Server hoch. Das Problem war nicht der KI-Einsatz. Es fehlten Richtlinien, die dem Schutzbedarf der betroffenen Daten entsprachen.
CNET veröffentlichte KI-generierte Finanzartikel ohne ausreichende redaktionelle Kontrolle. Fehler wurden in Dutzenden Artikeln gefunden. Der Schaden traf nicht einzelne Artikel — sondern die Glaubwürdigkeit des gesamten Redaktionsprozesses.
Drei Unternehmen. Drei Bereiche. Ein Mechanismus: Die Lücke zwischen dem, was eingesetzt wurde, und dem, was darüber verstanden wurde, wuchs schneller als die Fähigkeit, zu messen und zu korrigieren.
Was nötig ist, um den Überblick zu behalten
Die Unternehmen mit stabilen KI-Einsätzen teilen operative Merkmale, die sich schlechter ankündigen lassen als „wir sind KI-first".
Enge Einstiegspunkte. Der Einsatz beginnt mit Anfragentypen, bei denen eine falsche Antwort günstig und korrigierbar ist. Hohes Volumen, niedriges Risiko. Der Scope weitet sich aus, wenn das operative Vertrauen gewachsen ist — nicht davor.
Laufende Ausgabenkontrolle. KI-Modelle liefern keine statische Leistung. Die Sprache der Anfragen verändert sich. Neue Produkte schaffen neue Grenzfälle. Saisonale Muster verschieben die Interaktionsverteilung. Unternehmen mit engem Betrieb behandeln KI-Monitoring als dauerhafte Betriebsaufgabe, nicht als einmalige Kontrolle nach dem Start.
Übergabe an Mitarbeitende als bewusst gestalteter Moment. Wenn ein Kunde einen Menschen braucht, sollte der Wechsel nahtlos wirken. Vollständiger Kontexterhalt. Keine wiederholten Informationsanfragen. Das ist eine technische Investition, die für den Kunden unsichtbar und für die Kundenbindung erheblich ist.
Keine öffentlichen Stellenabbau-Ankündigungen. Jedes Unternehmen, das ankündigte „KI hat X Stellen ersetzt", hat damit eine Zahl in der Welt, die es nun öffentlich verteidigen muss. Die Unternehmen mit der größten operativen Flexibilität sind jene, die das nicht getan haben.
Der gemeinsame Nenner: Der Start war der Beginn der Arbeit, nicht ihr Ende.
Die Bereiche, in denen sich das zeigt
Kundenservice ist am sichtbarsten. Klarna, Duolingo und Air Canada — dessen Chatbot gerichtlich für falsche Tarifinformationen gegenüber einem Kunden haftbar gemacht wurde — stehen für die erste Welle. Die zweite, Unternehmen die nach internen Misserfolgen nachjustieren, findet gerade statt und ist größtenteils unsichtbar.
Content und Publishing. BuzzFeed, CNET und Sports Illustrated veröffentlichten KI-generierte Inhalte ohne ausreichende redaktionelle Kontrolle. Alle drei erlebten öffentliche Korrekturen oder redaktionelle Krisen. Der Unterschied zwischen denen, die ihrer Marke schadeten, und denen, die es nicht taten, lag nicht im KI-Einsatz — sondern darin, ob ein Mensch die letzte Entscheidung traf.
Softwareentwicklung. KI-Coding-Assistenten sind heute Standard in Engineering-Teams. Die Teams mit dem größten Nutzen haben ihre Code-Review-Prozesse angepasst, um KI-generierte Fehler vor dem Release zu finden. Teams ohne Anpassung shippen mehr Code, schneller — mit einer höheren Rate stiller Fehler.
Internes Wissen und Entscheidungsunterstützung. Der unsichtbarste Bereich, mit den längsten Rückkopplungsschleifen. Unternehmen, die KI für interne Analysen ohne Validierungsprozesse einsetzen, treffen Entscheidungen auf Basis von Outputs, die überzeugend falsch sein können. Die Fehler zeigen sich erst, wenn die Entscheidung bereits gefallen ist.
Wie der Markt sich spaltet
Drei Gruppen sind erkennbar.
Die erste Gruppe hat 2023 und 2024 lautstark eingeführt. Sie hat Produktionsdaten — manche davon teuer erkauft. Sie passt gerade an: Mensch-KI-Verhältnisse neu austarieren, Eskalationspfade umgestalten, Monitoring nachbauen. Sie liegt hinter der Entwicklung, die ihre Ankündigungen impliziert haben, aber sie hat operative Erfahrungen gesammelt, die neuere Einsteiger nicht haben.
Die zweite Gruppe steigt jetzt ein — mit 18 Monaten öffentlich dokumentierter Fehlschläge im Gepäck. Klarnas Zufriedenheitsproblem, das Air-Canada-Urteil, die CNET-Korrekturen: Diese Fälle stehen heute als Entscheidungsgrundlage zur Verfügung. Der Second-Mover-Vorteil in diesem Moment ist real und wird unterschätzt.
Die dritte Gruppe hat sich nicht bewegt. Für manche gibt es legitime Gründe: regulatorische Einschränkungen, technische Hürden, die eigene Kundschaft. Für die meisten ist der Grund Trägheit. Diese Gruppe akkumuliert einen Rückstand gegenüber Gruppe eins und zwei, der 2026 und 2027 sichtbar werden wird.
Die Spaltung betrifft nicht KI versus keine KI. Sie betrifft operative Reife — die Fähigkeit, einen Einsatz über Zeit zu betreiben, zu messen und zu verbessern. Diese Fähigkeit braucht länger aufzubauen als der erste Einsatz selbst und ist als Vorteil dauerhafter.
Das Urteil
Nicht schnell versus langsam. Nicht KI versus Mensch.
Die Unternehmen, die bei KI gewinnen, haben die Ankündigung als irrelevant behandelt und den Betrieb als das Eigentliche. Sie haben eng eingesetzt, genau gemessen und den Scope erweitert, wenn das Vertrauen gewachsen war. Sie haben keine KI-Transformationsgeschichten — weil sie die Transformation nicht als Geschichte behandelt haben.
Das Kontrollproblem ist kein technisches Problem. Es ist ein Managementproblem. Wissen Sie, was Ihre KI-Systeme tun? Können Sie es messen? Können Sie es korrigieren, bevor es für Kunden oder Behörden sichtbar wird?
Die Unternehmen, die alle drei Fragen mit Ja beantworten können, liegen vorne. Die, die es nicht können — unabhängig davon, wie laut sie ihre KI-Strategie angekündigt haben — gewinnen nicht. Sie managen.