Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

2 мин
Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

Google выпустила Gemini 3.1 Flash Live — модель, специально созданную для голосовых и визуальных агентов, работающих в реальном времени. Модель доступна в превью через Live api в Google AI Studio. По заявлению компании, она обеспечивает качественный скачок по задержке, надежности и естественности диалога относительно предыдущей 2.5 Flash Native Audio.

Ключевая особенность — устойчивость в шумной среде. Модель научилась отделять голос пользователя от фоновых звуков вроде телевизора или уличного движения и надежно выполнять инструкции даже при непредсказуемых поворотах разговора. В дополнение к этого, Flash Live поддерживает более 90 языков для мультимодальных диалогов в реальном времени и лучше распознаёт акустические нюансы — интонацию, темп, ударения.

Несколько компаний уже интегрировали схема в свои продукты. Дизайн-инструмент Stitch от Google позволяет управлять интерфейсом голосом — агент видит холст и может критиковать макеты или предлагать вариации. Устройство-компаньон Ato использует мультиязычные возможности модели для общения с пожилыми людьми. А студия Weekend встроила Flash Live в мастера подземелий своей RPG Wit's End — для театральной подачи реплик в реальном времени.

Релиз продолжает стратегию Google по фрагментации линейки Gemini под конкретные задачи: Flash-Lite — для дешевых массовых конвейеров, Flash — для баланса скорости и качества, а теперь Flash Live — для голосовых агентов, где критична минимальная задержка и натуральность диалога.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Bitdefender выпустила программа RealCheck для проверки видео на дипфейк

1 час назад

Bitdefender выпустила программа RealCheck для проверки видео на дипфейк

Организация Bitdefender выпустила RealCheck — программа для Android и iPhone, которое анализирует видео и определяет, подвергалось ли оно обработке с помощью искусственного интеллекта или нет. Читать

В США Instagram** теперь можно просматривать на телевизорах Samsung

2 часа назад

В США Instagram** теперь можно просматривать на телевизорах Samsung

Компания Meta* запустила программа Instagram** для телевизоров — оно доступно на моделях Samsung, выпущенных в 2020 году или позже. До этого Instagram** для телевидения был доступен только на устройст

3 часа назад

В России провели эксперимент по межспутниковой связи между низкой и геостационарной орбитами через спутник «Экспресс»

В России провели эксперимент по межспутниковой связи на двух орбитах. В нём участвовали ФГУП «Космическая связь» (ГП КС) и Особый технологический центр из Санкт‑Петербурга (ООО «СТЦ»). В процессе испы

Alibaba воровала информация Claude и обучала на них Qwen — теперь Anthropic жалуется властям

3 часа назад

Alibaba воровала информация Claude и обучала на них Qwen — теперь Anthropic жалуется властям

Anthropic пожаловалась нескольким сенаторам США и чиновникам Белого дома на Alibaba: в письме, о котором сообщило Bloomberg, компания назвала действия пользователей, связанных с лабораторией Qwen, кру

«Яндекс» внедрил в Алису AI бронирование ресторанов и запись в салоны прямо в чате для пользователей по всей России

4 часа назад

«Яндекс» внедрил в Алису AI бронирование ресторанов и запись в салоны прямо в чате для пользователей по всей России

Организация «Яндекс» добавила в Алису AI функцию бронирования столиков в ресторанах и записи в салоны красоты. С новой функцией пользователю не нужно переключаться между картами, поиском и сторонними