Google DeepMind выпустила Gemini 3.1 Flash TTS с управлением голосом через текст

1 мин
Google DeepMind выпустила Gemini 3.1 Flash TTS с управлением голосом через текст

Google DeepMind представила новую модель синтеза речи — Gemini 3.1 Flash TTS, сделав акцент на управляемости и гибкости генерации.

Главная фишка — Audio Tags. Это текстовые команды прямо внутри промпта, с помощью которых можно задавать стиль, эмоцию, темп и подачу речи. По сути, пользователь не просто генерирует голос, а «режиссирует» озвучку через текст.

Помимо этого, модель получила:

• более естественное и плавное звучание

• поддержку 70+ языков, в том числе русский

• встроенную маркировку аудио через SynthID, чтобы отличать синтезированную речь от реальной

По качеству схема сразу вошла в топ: на бенчмарке Artificial Analysis TTS Arena она заняла 2-е место с Elo-рейтингом 1211, уступив только Inworld TTS 1.5 Max и обогнав ElevenLabs v3.

Доступ к Gemini 3.1 Flash TTS уже открыт в формате preview через Gemini api и Google AI Studio, для бизнеса — через Vertex AI. В ближайшее время модель равным образом появится в пользовательских продуктах вроде Google Vids.

Это ещё один шаг к тому, чтобы голос в ИИ стал не просто функцией, а полноценным инструментом управления — почти как работа с актёром, только через промпт.

Читают сейчас

Anthropic выпустила Claude Opus 4.7

39 минут назад

Anthropic выпустила Claude Opus 4.7

Компания Anthropic представила новую версию своей флагманской модели Claude Opus 4.7. Апдейт направлено на усовершенствование качества работы в профессиональных сценариях, а не просто на рост бенчмарк

Вышел Claude Opus 4.7 — втрое лучше видит, строже слушает инструкции

48 минут назад

Вышел Claude Opus 4.7 — втрое лучше видит, строже слушает инструкции

Anthropic выпустила Claude Opus 4.7 — новую флагманскую схема общего доступа, которая заметно подтянулась в программировании, зрении и следовании инструкциям. Цена осталась прежней: $5 за миллион вход

Anthropic выпустили Claude Opus 4.7

1 час назад

Anthropic выпустили Claude Opus 4.7

Сегодня Anthropic объявила о выходе Claude Opus 4.7. Схема стала заметным шагом вперёд в программировании: в тестах на реальных задачах Cursor зафиксировал рост с 58% до 70%, CodeRabbit отметил усовер

Хакеры взломали крипторублёвую биржу Grinex и похитили более 1 млрд рублей

1 час назад

Хакеры взломали крипторублёвую биржу Grinex и похитили более 1 млрд рублей

Крипторублёвая биржа Grinex, обеспечивающая расчёты между российскими бизнесами и гражданами, сообщила о взломе. Хакеры похитили более 1 млрд рублей с кошельков биржи. Ознакомиться далее

2 часа назад

«Яндекс» реализовал в рекламную систему рекомендательную технологию Argus

Организация «Яндекс» внедрила в рекламную систему технологию Argus, которая работает на генеративных моделях.Это самое крупное апдейт нейросетевой рекламной архитектуры «Яндекс». Как рассказали информ