Google bringt diese Woche heimlich eine kostenlose Offline-KI-Diktier-App im iOS App Store an: die „AI Edge Eloquent“-Anwendung. Sie nutzt das lokale Gemma-ASR-Modell; dabei verlässt der Audio-Stream das Gerät vollständig nicht und landet, äußerst selten, zuerst auf der Android-Plattform, bevor es sich überhaupt um Android handelt.
(Vorgeschichte: Google hat das klügste offene Modell Gemma 4 veröffentlicht! Umstellung auf eine vollständige Apache-2.0-Lizenz, die Leistung kommt direkt an große geschlossene KI heran)
(Hintergrund-Ergänzung: Das Monopol von NVIDIA brechen? Googles stärkstes KI-Modell „Gemma 3“ mit 1x H100, schlägt DeepSeek und OpenAI)
Inhaltsverzeichnis
Toggle
Ohne Pressekonferenz, ohne irgendeine offizielle Ankündigung hat Google diese Woche etwas früher ganz stillschweigend „AI Edge Eloquent“ auf den iOS App Store gebracht. Diese App ist komplett kostenlos und ist eine KI-Diktier-App mit Fokus auf Offline-Spracherkennung. Im Hintergrund läuft das eigene Google-Gemma-Endgeräte-ASR (Automatische Spracherkennung)-Modell; alle Audioverarbeitungen werden lokal auf dem Gerät selbst erledigt, ohne dass eine Verbindung nötig ist.
Die Bedienlogik von „AI Edge Eloquent“ ist sehr intuitiv: Nach dem Öffnen der App spricht man in das Mikrofon, während der Bildschirm in Echtzeit Text sowie die Sprachwellen-Grafik anzeigt. Nach dem Stoppen der Aufnahme filtert die App automatisch umgangssprachliche Füllwörter wie „äh“ und „hmm“, korrigiert Satzabbrüche, ordnet die gesprochenen Inhalte zu sauberem, direkt nutzbarem Text und kopiert sie automatisch in die Zwischenablage.
Das Datenschut zdesign ist auch einer der Kern-Vermarktungspunkte dieser App. Im reinen Offline-Modus verlassen Audiodaten nicht das iPhone des Nutzers und werden an keinen Server übertragen. Google bietet außerdem die Option „Cloud-Modus“: Die Spracherkennung wird weiterhin auf dem Gerät abgeschlossen; lediglich der erkannte Text (nicht die Roh-Audiodaten) wird an das Gemini-Cloud-Modell geschickt, um ihn weiter zu bereinigen – mit höherer Qualität.
Der gesamte Dienst ist komplett kostenlos: keine Abo-Gebühren, keine Begrenzung der Nutzung.
Gleichzeitig hat die Tech-Medienlandschaft auf ein seltenes Phänomen aufmerksam gemacht: Googles Produkte gehen fast immer zuerst bei Android live. Besonders bei Funktionen rund um KI am Gerät wird üblicherweise in Kombination mit Pixel-Geräten und dem Gemini-Nano-Modell priorisiert gelauncht. Dieses Mal geht „AI Edge Eloquent“ jedoch einen umgekehrten Weg: In der Beschreibung im App Store steht sogar direkt, dass eine Android-Version als Nächstes erscheinen wird.
Analysten haben dafür zwei Interpretationen. Die erste ist ein Markttest: Google wählt möglicherweise bewusst iOS als „Nicht-Heimatmarkt“ für den Versuch, um die Akzeptanz und Nutzungsgewohnheiten der Verbraucher für KI-Diktierfunktionen am Gerät zu bewerten – ohne das Android-Ökosystem zu stören.
Die zweite ist, dass die Technik bereit ist: Das Gemma-ASR-Modell für iOS könnte in Bezug auf den Optimierungsfortschritt früher als die Android-Version die nutzbaren Standards erreichen. Daher entscheidet sich Google dafür, direkt zu veröffentlichen, statt beide Plattformen synchron zu starten.
Aus technischer Sicht besteht die Bedeutung von „AI Edge Eloquent“ nicht nur darin, ein Diktier-Tool zu sein. Gemma ist eine Open-Source-Leichtgewichts-KI-Modellreihe von Google. Die ursprüngliche Auslegung ist darauf gerichtet, auch in ressourcenbeschränkten Umgebungen effizient zu laufen – etwa auf mobilen Endgeräten. AI Edge ist wiederum das Framework, das Google Entwicklern anbietet, um Machine-Learning-Modelle direkt auf dem Gerät auszuführen.
Diese App bringt im Grunde die Endgeräte-Inferenzleistung von Gemma in typische Alltagsszenarien für Verbraucher.
Für Entwickler ist AI Edge Eloquent außerdem eine Referenz-Vorlage: Es zeigt, wie sich das Gemma-Modell in Produkten für den Massenmarkt umsetzen lässt, und wie die Offline- und Cloud-Mix-Architektur ein Gleichgewicht zwischen Datenschutz und Qualität herstellt.