1 час назад
Gemini 3.1 Flash Live — голосовой ИИ со скоростью живого диалога

Google выпустила Gemini 3.1 Flash Live — модель, специально созданную для голосовых и визуальных агентов, работающих в реальном времени. Модель доступна в превью через Live api в Google AI Studio. По заявлению компании, она обеспечивает качественный скачок по задержке, надежности и естественности диалога относительно предыдущей 2.5 Flash Native Audio.
Ключевая особенность — устойчивость в шумной среде. Модель научилась отделять голос пользователя от фоновых звуков вроде телевизора или уличного движения и надежно выполнять инструкции даже при непредсказуемых поворотах разговора. В дополнение к этого, Flash Live поддерживает более 90 языков для мультимодальных диалогов в реальном времени и лучше распознаёт акустические нюансы — интонацию, темп, ударения.
Несколько компаний уже интегрировали схема в свои продукты. Дизайн-инструмент Stitch от Google позволяет управлять интерфейсом голосом — агент видит холст и может критиковать макеты или предлагать вариации. Устройство-компаньон Ato использует мультиязычные возможности модели для общения с пожилыми людьми. А студия Weekend встроила Flash Live в мастера подземелий своей RPG Wit's End — для театральной подачи реплик в реальном времени.
Релиз продолжает стратегию Google по фрагментации линейки Gemini под конкретные задачи: Flash-Lite — для дешевых массовых конвейеров, Flash — для баланса скорости и качества, а теперь Flash Live — для голосовых агентов, где критична минимальная задержка и натуральность диалога.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас
35 минут назад
Россия начнёт разработку литографа для производства чипов по технологии 90 нм в 2026 году
В 2026 году Россия начнёт работу над созданием литографа для производства чипов по топологии 90 нм. Об этом 20 марта 2026 года на отраслевой научно-технической конференции радиоэлектронной промышленно
59 минут назад
VK представила доклад по финансовым данным за 2025 год
Компания VK опубликовала аудированную отчётность по стандартам МСФО и сегментные финансовые данные за 2025 год. Выручка компании по итогам года увеличилась на 8% по сравнению с 2024 годом и достигла 1
1 час назад
СМИ: «Минфин РФ предложил расширить доступ ФНС к данным о переводах между физлицами»
Министерство финансов РФ предложило обязать Банк России передавать Федеральной налоговой службе (ФНС) России информацию о россиянах, получающих вспомогательный доход на карту от других физических лиц
1 час назад
Авторы из Fplus раскрыли характеристики прототипа первой российской игровой приставки
Авторы из компании Fplus рассказали изданию «Газета.Ru» о характеристиках прототипа первой российской игровой приставки. Представители компании сообщили, что консоль будет выпущена не раньше заявленно
1 час назад
Учёные ВШЭ разработали нейросеть для автоматической диагностики неисправностей электродвигателей
Учёные Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ разработали метод Signature‑Guided Data Augmentation. Он определяет неисправность двигателей с точностью