Anthropic hat mit Claude 3.5 Sonnet ein neues Modell veröffentlicht, das für Büro-Prozesse relevant wird.
Die bisherige Debatte um Halluzinationen hat gelähmt. Viele Geschäftsführer sagen: Die KI erfindet Fakten, wir können sie nicht nutzen. Claude 3.5 Sonnet zeigt einen anderen Weg: Je enger der Auftrag, desto zuverlässiger das Ergebnis.
Der Unterschied zwischen Modell und Auftrag
Viele Tests vergleichen Sprachmodelle, als würde man Autos nach dem Motor vergleichen. Das ist nicht falsch, aber es übersieht, was im Unternehmen zählt. Für KMU gilt: Die KI ist nur so gut wie der Auftrag, den sie erhält.
Claude 3.5 Sonnet ist bei Aufträgen mit klaren Eingaben und engen Grenzen zuverlässiger geworden. Beispiel: Lese diese Rechnung, prüfe die Positionen gegen unsere Preisliste, markiere Abweichungen. Das ist ein enger Auftrag.
Wo ein KMU konkret testen sollte
Kundenmail-Zusammenfassung: Eingehende Mail lesen, fehlende Angaben markieren, Antwortstruktur vorschlagen. Rechnungsprüfung: Neue Rechnung mit historischer Preisliste vergleichen. Angebotserstellung: Aus Anfrage und Produktkatalog einen strukturierten Vorschlag machen. Sitzungsnotizen: Teams-Transkript zusammenfassen, Entscheidungen vs. offene Punkte sortieren.
Diese vier Fälle haben eins gemeinsam: Der Mensch bleibt der Prüfer. Die KI bereitet vor, entscheidet nicht. Genau dort wo Claude 3.5 Sonnet besser ist als frühere Versionen: beim Vorbereiten von schwierigen Fällen, ohne zu halluzinieren.
Die Kostenseite nicht vergessen
Neue Modelle sind nicht gratis. Anthropic bietet Claude 3.5 Sonnet über ein Pay-per-Token-Modell. Ein KMU sollte vor dem breiten Rollout eine kleine Test-Rechnung machen: Zehn Rechnungen pro Tag, 150 Token pro Prüfung = 1500 Token/Tag. Bei aktuellen Preisen (~$0.003 pro 1000 Token) = ~$0.005/Tag. Das ist minimal, also kein Kostentreiber. Aber es lohnt sich, zuerst die Fehlerquote zu kennen, bevor man hunderte Transaktionen pro Tag automatisiert.
Die Management-Entscheidung nach zwei Wochen Test sollte lauten: Haben wir die Fehlerquote um mindestens 30% gesenkt, verglichen mit manueller Prüfung ohne KI-Vorbereitung? Wenn ja, erweitern. Wenn nein, rückwärts.
Warum die Zuverlässigkeit jetzt besser ist
Sonnet 3.5 zeigt in Tests höhere Konsistenz bei wiederholten Aufgaben. Für KMU ist das entscheidend, weil der operative Manager nicht jeden Output prüfen kann. Er braucht ein System, auf das er sich verlassen kann.
Sonnet schafft das nicht wegen einer magischen Komponente, sondern durch Training auf stabilen Ausgaben. Anthropic hat vermutlich verstärkt, dass das Modell bei offenen Fragen zurückhält, statt zu erfinden. Das ist genau das, was KMU brauchen.
Recherchebasis: Anthropic Claude Sonnet, OpenAI O1, Google Gemini 2.
Nächster Schritt
Was heisst das für Ihre Büroarbeit?
- Zeitfresser wählen: E-Mail, Offerten, Rechnungen, Ablage oder Kundenantworten.
- Wirtschaftlich prüfen: CHF 79 lohnen sich schon, wenn rund eine Stunde Bürozeit besser priorisiert wird.
- Bezahlten Start nutzen: Der Detailreport macht aus dem Artikel einen konkreten Startplan.
DACH-Hinweis: 10min KI Brief bleibt für KMU im gesamten DACH-Raum lesbar; konkrete Praxisangebote sind zuerst CH-first formuliert.


