Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

2 мин
Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

Google выпустила Gemini 3.1 Flash Live — модель, специально созданную для голосовых и визуальных агентов, работающих в реальном времени. Модель доступна в превью через Live api в Google AI Studio. По заявлению компании, она обеспечивает качественный скачок по задержке, надежности и естественности диалога относительно предыдущей 2.5 Flash Native Audio.

Ключевая особенность — устойчивость в шумной среде. Модель научилась отделять голос пользователя от фоновых звуков вроде телевизора или уличного движения и надежно выполнять инструкции даже при непредсказуемых поворотах разговора. В дополнение к этого, Flash Live поддерживает более 90 языков для мультимодальных диалогов в реальном времени и лучше распознаёт акустические нюансы — интонацию, темп, ударения.

Несколько компаний уже интегрировали схема в свои продукты. Дизайн-инструмент Stitch от Google позволяет управлять интерфейсом голосом — агент видит холст и может критиковать макеты или предлагать вариации. Устройство-компаньон Ato использует мультиязычные возможности модели для общения с пожилыми людьми. А студия Weekend встроила Flash Live в мастера подземелий своей RPG Wit's End — для театральной подачи реплик в реальном времени.

Релиз продолжает стратегию Google по фрагментации линейки Gemini под конкретные задачи: Flash-Lite — для дешевых массовых конвейеров, Flash — для баланса скорости и качества, а теперь Flash Live — для голосовых агентов, где критична минимальная задержка и натуральность диалога.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

35 минут назад

Россия начнёт разработку литографа для производства чипов по технологии 90 нм в 2026 году

В 2026 году Россия начнёт работу над созданием литографа для производства чипов по топологии 90 нм. Об этом 20 марта 2026 года на отраслевой научно-технической конференции радиоэлектронной промышленно

59 минут назад

VK представила доклад по финансовым данным за 2025 год

Компания VK опубликовала аудированную отчётность по стандартам МСФО и сегментные финансовые данные за 2025 год. Выручка компании по итогам года увеличилась на 8% по сравнению с 2024 годом и достигла 1

1 час назад

СМИ: «Минфин РФ предложил расширить доступ ФНС к данным о переводах между физлицами»

Министерство финансов РФ предложило обязать Банк России передавать Федеральной налоговой службе (ФНС) России информацию о россиянах, получающих вспомогательный доход на карту от других физических лиц

1 час назад

Авторы из Fplus раскрыли характеристики прототипа первой российской игровой приставки

Авторы из компании Fplus рассказали изданию «Газета.Ru» о характеристиках прототипа первой российской игровой приставки. Представители компании сообщили, что консоль будет выпущена не раньше заявленно

1 час назад

Учёные ВШЭ разработали нейросеть для автоматической диагностики неисправностей электродвигателей

Учёные Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ разработали метод Signature‑Guided Data Augmentation. Он определяет неисправность двигателей с точностью