Google тайно разместила на iOS App Store бесплатное офлайн-приложение для ИИ-транскрибации «AI Edge Eloquent» на этой неделе: используется on-device модель Gemma ASR, аудио полностью не покидает устройство, и, что редкость, приложение появилось на платформе iOS раньше, чем на Android.
(Контекст: Google выпустила самые умные открытые модели Gemma 4! Полностью перешла на лицензию Apache 2.0, производительность вплотную приближается к крупным закрытым ИИ)
(Дополнение по фону: сломать монополию Nvidia? Самая сильная на Земле ИИ-модель Google «Gemma 3» с 1 H100 обходит DeepSeek, OpenAI)
Содержание статьи
Toggle
Без пресс-конференций и без каких-либо официальных объявлений Google так просто, чуть раньше на этой неделе, тихо вывела «AI Edge Eloquent» в iOS App Store. Это полностью бесплатное приложение для ИИ-транскрибации, ориентированное на офлайн-распознавание речи: в основе — собственная on-device ASR (автоматическое распознавание речи) модель Google Gemma. Все операции с аудио выполняются локально на устройстве, не требуется подключение к сети.
Логика работы «AI Edge Eloquent» очень интуитивна: откройте приложение, говорите в микрофон — на экране в реальном времени отображаются текст и форма звуковой волны. После остановки записи приложение автоматически фильтрует разговорные лишние слова вроде «мм», «ээ», исправляет разбиение на фразы, приводит сказанное в чистый, готовый к использованию текст и автоматически копирует его в буфер обмена.
Конфиденциальность — один из ключевых аргументов в пользу этого приложения. В режиме полностью офлайн аудиоданные не покидают iPhone пользователя и не отправляются ни на какие серверы. Google также предлагает опцию «облачного режима»: распознавание речи по-прежнему выполняется на устройстве, а в облачную модель Gemini отправляется только распознанный текст (а не исходное аудио) для дальнейшей очистки, что повышает качество.
Весь сервис полностью бесплатен: без подписки и без ограничений по объёму использования.
Одновременно технологические медиа заметили редкое явление: продукты Google почти всегда выходят сначала на Android, особенно функции, связанные с on-device ИИ. Обычно они сначала появляются вместе с устройствами Pixel и моделью Gemini Nano. На этот раз «AI Edge Eloquent» пошла вразрез с правилами: в описании App Store прямо указано, что версия для Android уже скоро выйдет.
У аналитиков есть два объяснения. Первое — рыночное тестирование: Google, вероятно, намеренно выбирает iOS — «не свою основную площадку» — чтобы провести эксперимент, оценивая, насколько потребители принимают on-device ИИ для диктовки и как они будут пользоваться им, не вмешиваясь в экосистему Android.
Второе — техническая готовность: модель Gemma ASR для iOS, возможно, раньше достигла применимого стандарта по оптимизации, чем версия для Android. Поэтому Google выбрала публикацию сразу, а не ожидание синхронного выхода на обеих платформах.
С технической точки зрения смысл «AI Edge Eloquent» — не только в том, что это инструмент для транскрибации. Gemma — это серия легковесных открытых ИИ-моделей от Google; изначальная задумка — обеспечить эффективную работу в средах с ограниченными ресурсами, таких как мобильные устройства. Edge AI — это то, как Google позволяет разработчикам выполнять ML-модели прямо на устройстве.
По сути, это приложение переносит возможности on-device вывода Gemma в повседневные сценарии использования для потребителей.
Для разработчиков AI Edge Eloquent тоже является показательной моделью: демонстрирует, как Gemma-модели внедряются в потребительские продукты, и как смешанная on-device/облачная архитектура позволяет находить баланс между приватностью и качеством.