Google тихо выпустила офлайн-диктовку с ИИ для iPhone

2 мин
Google тихо выпустила офлайн-диктовку с ИИ для iPhone

Google без отдельного анонса выпустила на iOS программа Google AI Edge Eloquent — диктовку с упором на локальную обработку и работу без интернета. После загрузки моделей распознавания речи программа может расшифровывать голос прямо на устройстве, а затем автоматически убирать слова-паразиты, самопоправки и сглаживать текст до более чистого вида.

По сути это не просто speech-to-text, а попытка превратить сырую речь в текст, который уже можно вставлять в заметки, письма или сообщения почти без ручной правки. В приложении есть режимы преобразования вроде Key points, Formal, Short и Long, а рядом с локальной обработкой предусмотрен и облачный режим: если его включить, текстовая доработка может выполняться через модели Gemini.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.

Главная практическая деталь здесь — именно offline-first решение. Когда облачный режим отключен, приложение работает локально, а значит выглядит как более приватная альтернатива сервисам, где голос и текст постоянно уходят в облако. Для такого сценария Google использует Gemma-базированные ASR-модели; в карточке приложения также указано, что можно подтягивать пользовательские слова, имена и жаргон, включая из Gmail, если потребитель сам этого хочет.

Приложение также хранит историю сессий, умеет искать по прошлым диктовкам и показывает простую статистику вроде скорости речи и числа надиктованных слов. Сейчас оно доступно только на iOS, но в описании уже есть упоминания Android-версии и системной интеграции на Android через клавиатуру и плавающую кнопку быстрого доступа.

Вывод: суть не в том, что Google сделала еще одну диктовку, а в том, что компания тихо заходит в уже разогретую нишу AI-транскрипции с вполне понятной ставкой: локальная обработка, нулевая подписка на входе и “полированный” текст вместо буквальной расшифровки. Если эксперимент взлетит, второй логичный шаг — перенос таких же функций глубже в Android и системный ввод текста

Читают сейчас

54 минуты назад

Учёные предложили добывать «белый» водород

Водород бывает разных цветов — точнее, так его обозначают экологи и промышленники, имея в виду разные способы получения. «Коричневый» водород зарабатывают при сжигании угля, «серый» — из метана. Более

Perplexity выложила в open-source Bumblebee: read-only сканер ИИ-окружений для защиты от supply-chain атак

1 час назад

Perplexity выложила в open-source Bumblebee: read-only сканер ИИ-окружений для защиты от supply-chain атак

Perplexity AI открыла исходный код Bumblebee - статического сканера для защиты локальных машин от атак на цепочки поставок (supply-chain). Утилита написана на Go и проверяет конфигурации агентов, расш

LLMStart.ru запускает продвинутую программу Deep Agents для разработки сложных ИИ-систем

1 час назад

LLMStart.ru запускает продвинутую программу Deep Agents для разработки сложных ИИ-систем

28 мая стартует онлайн-курс Deep Agents от LLMStart.ru, направленный на проектирование сложных ИИ-систем и подход архитектурных проблем RAG при работе с неструктурированными данными. В контексте курса

Как AI меняет процессы разработки: закрытая сессия red_mad_robot

3 часа назад

Как AI меняет процессы разработки: закрытая сессия red_mad_robot

28 мая наша команда проведёт закрытую офлайн-встречу, посвящённую изменениям в инженерных процессах и разработке с AI. На встрече обсудим переход от локального использования AI к более системной работ

3 часа назад

Мы запустили Маркуса — виртуальный помощник команды маркетинга и коммуникаций

Маркус — это мультиагентная ИИ-система, помогающая СМО и его команде со всеми ключевыми функциями современного маркетинга: от аналитики и исследований рынка до генерации идей, создания коммуникационны