Agenten-KI im Unternehmen: Der Stoppsatz vor dem ersten produktiven Pilot

Die neue Enterprise-KI wird gerade weniger als einzelnes Chatfenster und stärker als Produktionsschicht beschrieben. OpenAI spricht bei Frontier von Agenten, Business Context, Ausführung in realen Workflows, Evaluation und Governance. Für ein KMU klingt das schnell nach Konzernprogramm. Der praktische Punkt ist aber kleiner: Wenn KI in mehreren Systemen arbeiten soll, braucht sie einen Auftrag, der enger ist als die Verkaufsfolie.

Der Fehler vieler Pilotprojekte liegt nicht im Modell, sondern im Auftrag. Ein Team testet eine Agentenfunktion, lässt sie Mails lesen, Dokumente suchen, eine Antwort formulieren und vielleicht noch Daten in eine Tabelle übertragen. Nach drei Tagen ist niemand sicher, ob die KI nur vorbereitet oder schon entschieden hat. Genau dort entsteht das Risiko. Der erste Agent in einem kleinen Unternehmen braucht deshalb keine grosse Architekturzeichnung. Er braucht einen Stoppsatz.

Der Stoppsatz kommt vor dem Tooltest

Ein brauchbarer Stoppsatz lautet zum Beispiel: „Die KI darf den Vorgang strukturieren, offene Punkte markieren und einen Entwurf erstellen; sie darf keine Zusage, keine Zahlung, keine Preisänderung und keine Kundennachricht auslösen.“ Dieser Satz ist unspektakulär, aber er verwandelt einen diffusen Agentenversuch in einen steuerbaren Arbeitsfall. Er hilft auch dann, wenn später ein anderes Tool gewählt wird.

Für Geschäftsleitungen ist diese Reihenfolge wichtig. Wer zuerst nach dem Anbieter fragt, vergleicht Funktionen. Wer zuerst den Stoppsatz formuliert, vergleicht Verantwortung. Das ist gerade bei agentischen Systemen entscheidend, weil der Nutzen nicht nur in der Textqualität liegt. Der Nutzen liegt darin, dass ein Vorgang schneller vorbereitet wird, ohne dass die Entscheidung unsichtbar verschoben wird.

Ein realer KMU-Fall: die Lieferantenanfrage

Nehmen wir eine Lieferantenanfrage mit Preisänderung. Die KI darf die bisherige Korrespondenz zusammenfassen, die letzte Vereinbarung nennen, fehlende Angaben markieren und eine Antwortstruktur vorschlagen. Sie darf nicht den neuen Preis akzeptieren, nicht die Buchhaltung informieren und nicht den Liefertermin bestätigen. Damit bleibt der Prozess produktiv: Die verantwortliche Person startet mit einer sauberen Lagekarte, nicht mit einem leeren Postfach.

Nach zehn solchen Fällen sieht das Unternehmen mehr als in jeder Demo. Es erkennt, welche Eingaben fehlen, welche Vorschläge korrigiert werden mussten und wo der Stoppsatz zu grob war. Vielleicht ist „Preisänderung“ noch zu breit. Vielleicht braucht es eine Sonderregel für Stammkunden, Auslandslieferanten oder neue Bankverbindungen. Diese Erkenntnisse entstehen nur im echten Fall, aber sie müssen in einem engen Rahmen entstehen.

Vier Felder für den ersten Agentenauftrag

  • Arbeitsfall: welcher wiederkehrende Vorgang wird vorbereitet, etwa Lieferantenanfrage, Kundenmail, Sitzungsnotiz oder Offertengliederung?
  • Quellenraum: welche Postfächer, Dokumente oder Tabellen darf die KI verwenden, und welche bleiben ausgeschlossen?
  • Ausgabe: soll sie markieren, sortieren, zusammenfassen, vergleichen oder einen Entwurf schreiben?
  • Stoppsatz: welche Aktion bleibt ausdrücklich menschlich, bevor etwas das Unternehmen verlässt oder verändert?

Diese vier Felder reichen für den Start. Sie verhindern, dass ein Pilot gleichzeitig Toolauswahl, Prozessdesign, Datenfreigabe und Change-Management sein will. Ein kleiner Betrieb kann den ersten Auftrag auf einer Seite festhalten und mit fünf bis zehn echten Fällen testen. Danach wird nicht diskutiert, ob KI „gut“ oder „schlecht“ ist, sondern ob dieser eine Auftrag im Alltag hilft.

Warum Evaluation nicht erst für Konzerne relevant ist

OpenAI betont bei Enterprise-Agenten auch Evaluation und Optimierung. Das klingt technisch, lässt sich aber auf KMU-Niveau einfach übersetzen: Wie oft lag die Markierung richtig? Welche Korrekturen waren nötig? Wurde ein roter Fall rechtzeitig erkannt? Hat der Entwurf Zeit gespart oder neue Prüfung erzeugt? Diese vier Fragen sind eine kleine Evaluation. Sie sind wertvoller als ein Bauchgefühl nach der ersten Woche.

Wichtig ist, dass die Messung keine Scheinpräzision erzeugt. Ein Unternehmen muss nicht behaupten, der Agent spare exakt eine bestimmte Prozentzahl. Es reicht, die Fälle sauber zu zählen: zehn Anfragen, drei fehlende Angaben früher erkannt, zwei Vorschläge verworfen, ein Stoppsatz erweitert. Daraus entsteht belastbare Steuerung.

Die Managemententscheidung nach zwei Wochen

Nach zwei Wochen sollte die Geschäftsführung nicht fragen, ob alle begeistert sind. Sie sollte drei Entscheidungen treffen: Bleibt der Auftrag gleich, wird er enger oder wird er erweitert? Welche Datenquelle darf neu hinzu, wenn der erste Test stabil war? Welche Aktion bleibt weiterhin ausgeschlossen? So wächst agentische KI nicht über Euphorie, sondern über kontrollierte Grenzverschiebung.

Das aktuelle Signal aus dem Markt ist klar: Agenten werden näher an reale Unternehmensabläufe rücken. KMU müssen darauf nicht mit Hektik reagieren. Sie sollten diese Woche einen einzigen Vorgang auswählen, den Stoppsatz formulieren und zehn echte Fälle protokollieren. Wer so startet, nutzt die Agentenwelle als Prozessdisziplin statt als unübersichtliches Experiment.

Recherchebasis: OpenAI Frontier. OpenAI Enterprise-Strategie. Microsoft 365 Copilot Release Notes.

Nächster Schritt

Was heisst das für KI-Regeln und Nachweise?

  • Nutzung sichtbar machen: Welche Teams nutzen welche KI-Tools?
  • Daten und Freigaben klären: Was darf in ChatGPT, Copilot oder andere Tools?
  • Nachweise vorbereiten: Regeln, Rollen und Unterweisung dokumentieren.
KI-Regelcheck starten

DACH-Hinweis: 10min KI Brief bleibt für KMU im gesamten DACH-Raum lesbar; konkrete Praxisangebote sind zuerst CH-first formuliert.

Nach oben scrollen

Kategorien

Neueste Beiträge