Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

2 мин
Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

Google выпустила Gemini 3.1 Flash Live — модель, специально созданную для голосовых и визуальных агентов, работающих в реальном времени. Модель доступна в превью через Live api в Google AI Studio. По заявлению компании, она обеспечивает качественный скачок по задержке, надежности и естественности диалога относительно предыдущей 2.5 Flash Native Audio.

Ключевая особенность — устойчивость в шумной среде. Модель научилась отделять голос пользователя от фоновых звуков вроде телевизора или уличного движения и надежно выполнять инструкции даже при непредсказуемых поворотах разговора. В дополнение к этого, Flash Live поддерживает более 90 языков для мультимодальных диалогов в реальном времени и лучше распознаёт акустические нюансы — интонацию, темп, ударения.

Несколько компаний уже интегрировали схема в свои продукты. Дизайн-инструмент Stitch от Google позволяет управлять интерфейсом голосом — агент видит холст и может критиковать макеты или предлагать вариации. Устройство-компаньон Ato использует мультиязычные возможности модели для общения с пожилыми людьми. А студия Weekend встроила Flash Live в мастера подземелий своей RPG Wit's End — для театральной подачи реплик в реальном времени.

Релиз продолжает стратегию Google по фрагментации линейки Gemini под конкретные задачи: Flash-Lite — для дешевых массовых конвейеров, Flash — для баланса скорости и качества, а теперь Flash Live — для голосовых агентов, где критична минимальная задержка и натуральность диалога.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Основной критик LLM почти похвалил Claude Mythos. Почти

3 часа назад

Основной критик LLM почти похвалил Claude Mythos. Почти

Гэри Маркус, один из самых известных критиков современного ИИ, неожиданно мягко прокомментировал свежие результаты Claude Mythos на бенчмарке METR. На последнем замере модель Anthropic показала горизо

4 часа назад

ИИ не пройдёт: в России предложили законодательно запретить алгоритмам «отсеивать» резюме

В России предложили законодательно запретить ИИ-скрининг резюме. Соответствующая инициатива зарегистрирована на портале «Российская общественная проект» под номером 52Ф148061. Разработчики требуют зап

Маск пытался переманить Альтмана в Tesla — еще до раскола OpenAI

4 часа назад

Маск пытался переманить Альтмана в Tesla — еще до раскола OpenAI

На второй неделе процесса Musk v. Altman в федеральном суде Окленда вскрылся неудобный для Илона Маска факт: к концу 2017 года, еще будучи членом совета OpenAI, он пытался переманить Сэма Альтмана к с

6 часов назад

Новое открытие в области нейробиологии: природа тоже занимается оптимизацией нейросетей с помощью прунинга

Способ повышения эффективности искусственных нейросетей путем удаления лишних межнейронных связей, имеющих после обучения близкие к нулю значения весов (так называемый прунинг) неожиданно оказался одн

Opus 4.6 в 81% попыток сам «копирует себя» на чужой хост через дыру в коде — исследование Palisade

8 часов назад

Opus 4.6 в 81% попыток сам «копирует себя» на чужой хост через дыру в коде — исследование Palisade

Лаборатория Palisade Research замерила, как часто современные ИИ-модели сами могут взломать чужой сервер и инсталлировать туда копию своих весов. У Claude Opus 4.6 получилось в 81% попыток, у GPT-5.4