Mistral выпустила открытую схема синтеза речи Voxtral

1 мин
Mistral выпустила открытую схема синтеза речи Voxtral

Организация Mistral AI представила схема Voxtral TTS, предназначенную для генерации речи с высокой степенью реализма. Модель поддерживает 9 языков и умеет клонировать голос по короткому аудиосэмплу длительностью менее 5 секунд, передавая не только тембр, но и микроинтонации, акценты и особенности дикции.

Одной из ключевых возможностей Voxtral стала способность переключаться между языками на лету, сохраняя одновременно характеристики исходного голоса. Это открывает новые сценарии использования, в том числе мультиязычные голосовые интерфейсы и персонализированные аудиосервисы.

Архитектура модели построена на базе LLM Ministral 3B. Разработчики сделали акцент на скорости: генерация 10-секундного аудио занимает приблизительно 1,6 секунды, что даёт возможность применять модель в реальном времени без заметных задержек.

Веса базовой версии опубликованы на Hugging Face под некоммерческой лицензией. Также протестировать схема можно через Mistral Studio и Le Chat. Запуск Voxtral подтверждает тренд на открытые и быстрые голосовые модели, которые могут конкурировать с закрытыми решениями по качеству и удобству.

Читают сейчас

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

34 минуты назад

Anthropic урезает лимиты Claude в пиковые часы — это затронет 7% подписчиков Pro

Anthropic меняет систему лимитов Claude для всех тарифов — Free, Pro и Max. В будни с 5:00 до 11:00 по тихоокеанскому времени (с 15:00 до 21:00 по Москве) пятичасовые лимиты на использование будут рас

«Т‑банк» стартовал блокировать покупки в магазине «Буки» в связи с риска мошенничества

47 минут назад

«Т‑банк» стартовал блокировать покупки в магазине «Буки» в связи с риска мошенничества

«Т‑банк» стартовал ограничивать операции на сайте издателя и дистрибутора компьютерных игр «Бука» из‑за возможного использования площадки в мошеннических схемах. Об этом сообщили источники «Ъ» в крупн

Я разработал браузерную игру, где каждое нажатие кнопки убивает людей

1 час назад

Я разработал браузерную игру, где каждое нажатие кнопки убивает людей

Большинство военных игр воспевают победу. BORDER демонстрирует, чего она стоила. — Микроистории об отдельных погибших — Уведомления о потерях при 100 000, 500 000, 1 000 убитых — Мемориал, где вы може

Регулятор Калифорнии: Tesla «не предоставляет услуги беспилотных автомобилей»

1 час назад

Регулятор Калифорнии: Tesla «не предоставляет услуги беспилотных автомобилей»

Главный регулятор транспортной отрасли Калифорнии заявил, что Tesla не предоставляет услуги беспилотных автомобилей в штате, а обладает разрешением, аналогичным тому, что зарабатывают компании проката

Intel представила видеокарты Arc Pro B70 и B65 для ИИ-вычислений

1 час назад

Intel представила видеокарты Arc Pro B70 и B65 для ИИ-вычислений

Компания Intel анонсировала новые профессиональные видеокарты Arc Pro B70 и B65, ориентированные на инференс нейросетей и ресурсоемкие вычисления. Обе модели построены на архитектуре Battlemage и расс