Google DeepMind выпустила Gemini 3.1 Flash TTS с управлением голосом через текст

1 мин
Google DeepMind выпустила Gemini 3.1 Flash TTS с управлением голосом через текст

Google DeepMind представила новую модель синтеза речи — Gemini 3.1 Flash TTS, сделав акцент на управляемости и гибкости генерации.

Главная фишка — Audio Tags. Это текстовые команды прямо внутри промпта, с помощью которых можно задавать стиль, эмоцию, темп и подачу речи. По сути, пользователь не просто генерирует голос, а «режиссирует» озвучку через текст.

Помимо этого, модель получила:

• более естественное и плавное звучание

• поддержку 70+ языков, в том числе русский

• встроенную маркировку аудио через SynthID, чтобы отличать синтезированную речь от реальной

По качеству схема сразу вошла в топ: на бенчмарке Artificial Analysis TTS Arena она заняла 2-е место с Elo-рейтингом 1211, уступив только Inworld TTS 1.5 Max и обогнав ElevenLabs v3.

Доступ к Gemini 3.1 Flash TTS уже открыт в формате preview через Gemini api и Google AI Studio, для бизнеса — через Vertex AI. В ближайшее время модель равным образом появится в пользовательских продуктах вроде Google Vids.

Это ещё один шаг к тому, чтобы голос в ИИ стал не просто функцией, а полноценным инструментом управления — почти как работа с актёром, только через промпт.

Читают сейчас

8 минут назад

ГК «Элемент» разработает стратегию внедрения искусственного интеллекта в микроэлектронное производство

Группа компаний (ГК) «Элемент» разрабатывает стратегию единого цифрового контура микроэлектроники. Система будет управлять производством электронных компонентов на основе искусственного интеллекта. Пр

1 час назад

«Лаборатория Касперского» участвовала в операции Ramz Интерпола по борьбе с киберпреступностью

Компания «Лаборатория Касперского» приняла участие в операции Интерпола Ramz. Операция была направлена на борьбу с киберпреступностью на Ближнем Востоке и в Северной Африке. Организация передала между

ИИ самостоятельно решил задачу Эрдёша, подход одобрено математиками

2 часа назад

ИИ самостоятельно решил задачу Эрдёша, подход одобрено математиками

Модель искусственного интеллекта (ИИ) решила математическую задачу, над которой бились 80 лет. Проблема о плоских единичных расстояниях, впервые поставленная венгерским математиком Полом Эрдёшем в 194

2 часа назад

СМИ: «„Газпром“ может продать сборочное производство космических аппаратов в подмосковном Щёлково и собственный ЦУП»

Организация «Газпром» рассматривает продажу предприятия по производству спутников «Газпром СПКА» компании «Новый старт» до конца 2026 года. Сообщается о сборочном производстве космических аппаратов в

2 часа назад

«Группа Астра» создала отдельное направление для ИИ, для чего купила часть компании «АИБ», занимающуюся ИИ‑проектами

«Группа Астра» выделила разработки в области искусственного интеллекта в отдельное направление и представила бренд «Астра ИИ». Решения предназначены для работы внутри инфраструктуры заказчика. Сообщае