Google Gemini 2.0: Die KI, die Webseiten klickt
Google gab diese Woche Gemini 2.0 frei — und der Fokus ist nicht Text oder Bilder, sondern etwas viel Praktischeres: Eine KI, die deinen Bildschirm versteht und darin automatisch klickt, tippt und scrollt. Für KMU bedeutet das: Manuelles Datenerfassen, Copy-Paste-Arbeit, und UI-Navigation könnten bald von KI übernommen werden.
Was ist Gemini 2.0 und warum ist es anders?
Frühere Modelle konnten Screenshots analysieren („Das ist ein Login-Formular“). Gemini 2.0 kann nicht nur analysieren — es kann auch interagieren. Mit dem neuen „Web Agent“-Feature (Gemini 2.0 Advanced) kann die KI:
- Screenshots von Webseiten analysieren.
- Automatisch das richtige Feld für Daten erkennen.
- In HTML-Formularfelder klicken und tippen.
- Seiten durchnavigieren (Links folgen, scrolling durchführen).
- Multi-Step-Workflows automatisch abschließen.
Google nennt das „KI Overviews for Actions“ — die KI sieht deine Aufgabe, versteht die Webseite, und führt die Aktion aus, ohne dass du einen Finger rührst.
In Googles Ankündigung wird gezeigt, wie Gemini 2.0 automatisch einen Flug bucht, einen Hotel reserviert, und eine Mietwagen-Anfrage auf drei verschiedenen Webseiten abwickelt — ohne menschliche Zwischenschritte.
Praktische KMU-Fallbeispiele
Szenario 1: Automatisierte Lieferanten-Integration
Dein Großhandel arbeitet mit 5 verschiedenen Lieferanten. Jeder hat sein eigenes Portal (unterschiedliche Designs, unterschiedliche Logins). Ein Mitarbeiter sitzt täglich 3 Stunden da und gibt Bestellmengen ein. Mit Gemini 2.0 machst du das so: Du sagst der KI „Bei Supplier A neuer Auftrag: 500 Einheiten Artikel 12345, Lieferdatum 2026-07-15“ — und Gemini 2.0 loggt sich in alle 5 Portale ein, findet die richtigen Felder, trägt die Daten ein, und klickt Submit. Ergebnis: 3 Stunden Zeitersparnis pro Tag, 5 Tage pro Woche = 15 Stunden weniger manuelle Arbeit.
Szenario 2: Kundendaten-Aktualisierung über unterschiedliche Systeme
Du hast eine Kundin, deren Adresse sich geändert hat. Diese Adresse muss in 8 Systemen aktualisiert werden: E-Mail-Marketing, CRM, Accounting, Shipping, Versicherung, Website, Portal, Newsletter. Normalerweise: 1,5 Stunden manuelles Update in 8 verschiedenen Systemen. Mit Gemini 2.0: Eine Person gibt die neue Adresse ein. Die KI aktualisiert alle 8 Systeme parallel, prüft auf Fehler, und rapportiert zurück. Zeit: 10 Minuten.
Szenario 3: Preisvergleich und Marktüberwachung
Du bist ein Einzelhandel und musst täglich die Preise von 3 Konkurrenten überprüfen (auf ihren Webseiten), um deine Preise anzupassen. Das sind 10 Seiten, 5 Minuten manuelles Suchen pro Tag. Gemini 2.0 macht das automatisch: Jeden Morgen um 8 Uhr überprüft die KI die Konkurrenz-Preise auf den 3 Seiten, extrahiert die Daten, und gibt dir eine Übersicht: „Konkurrent A hat Preis gesenkt um 5%, Konkurrent B gleichgeblieben, Konkurrent C um 3% erhöht.“ Dann kannst du sofort deine Preislogik anpassen.
Wann lohnt sich Gemini 2.0?
Gemini 2.0 Advanced kostet $20/Monat (Premium-Plan). Lohnt sich das?
Ja, wenn:
- Du repetitive Web-Navigation hast, die täglich 2+ Stunden verursacht.
- Die Aufgabe „dumb rule-based“ ist (immer die gleichen Schritte, immer die gleiche Seite).
- Du keine KI-Integration zum Zielsystem hast (oder die wäre teuer).
Nein, wenn:
- Die Zielseiten sich ständig ändern (Design, Feldnamen). Dann wird die KI verwirrt.
- Du komplexe Business-Logik brauchst („Preis A, aber nur wenn Menge > 100 und Kundentier = Gold“). Das kann Gemini 2.0 nicht alleine.
- Die Integration eine echte REST-KI hat — dann ist RPA oder Zapier billiger.
Die Realität: Nicht überall ein Drop-In-Replacement
Gemini 2.0 ist gut für Fallback-Automatisierung: „Ich habe keine KI, also lasse ich die KI die UI bedienen.“ Das ist besser als Manual, aber nicht so stabil wie echte Integrationen.
Auch wichtig: Wenn die Webseite dich als Bot erkennt und dich aussperrt (Cloudflare, bot-detection), wird Gemini 2.0 auch ausgesperrt. Das ist kein Fehler in Gemini; das ist Architektur des Webs.
Fazit: Ein neuer Layer der Automatisierung
Gemini 2.0 eröffnet eine neue Kategorie: „UI Automation as a Service“. Das ist nicht RPA (Robotic Process Automation, die lokal auf deinem Desktop läuft). Das ist Cloud-native KI, die deine Befehle versteht und Webseiten navigiert.
Für KMU mit vielen manuellen Web-Aufgaben ist das ein echter Gamechanger. Aber es ist nicht „eine KI, die alles macht“ — es ist ein Werkzeug mit klaren Grenzen.
Wer jetzt experimentiert, gewinnt einen Monat Erfahrung vor den Konkurrenten.
Lesetipps:
- Google: Gemini 2.0 Ankündigung
- Financial Times: Wie KI Workflows automatisiert
- McKinsey: KI-gestützte Web-Automatisierung im Unternehmenseinsatz
Nächster Schritt
Was heisst das für Ihre Büroarbeit?
- Zeitfresser wählen: E-Mail, Offerten, Rechnungen, Ablage oder Kundenantworten.
- Wirtschaftlich prüfen: CHF 79 lohnen sich schon, wenn rund eine Stunde Bürozeit besser priorisiert wird.
- Bezahlten Start nutzen: Der Detailreport macht aus dem Artikel einen konkreten Startplan.
DACH-Hinweis: 10min KI Brief bleibt für KMU im gesamten DACH-Raum lesbar; konkrete Praxisangebote sind zuerst CH-first formuliert.

