Mistral выпустила open source-модель для генерации речи

1 мин
Mistral выпустила open source-модель для генерации речи

Французская Mistral представила Voxtral TTS — новую open source-модель для генерации речи. Компания позиционирует ее как решение для голосовых ассистентов и корпоративных сценариев вроде клиентской поддержки, продаж и голосовых агентов. По сути, Mistral заходит на территорию, где сейчас активно работают ElevenLabs, Deepgram и OpenAI.

Voxtral TTS поддерживает девять языков: английский, французский, немецкий, испанский, нидерландский, португальский, итальянский, хинди и арабский. В Mistral отдельно подчеркивают, что модель сделали компактной: она должна запускаться не только на серверах, но и на смартфонах, ноутбуках и других edge-устройствах.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.

Это значимый акцент. Сегмент TTS давно движется в сторону более естественной и быстрой генерации голоса, но чаще всего такие решения остаются либо закрытыми, либо завязаны на облако. Mistral делает ставку на обратный решение: более легкая схема, ниже стоимость запуска и больше контроля для компаний, которым важно не выносить голосовые данные во внешние сервисы.

Для самой Mistral это еще один шаг в сторону полноценного AI-стека для enterprise. Ранее организация уже продвигала свои решения для кастомных моделей и speech-задач, а теперь закрывает еще и слой генерации голоса. На фоне роста спроса на голосовых агентов это выглядит как вполне логичное плагин линейки.

Читают сейчас

Meta* выпустила ИИ-двойника человеческого мозга — он предсказывает реакции, а не мысли

50 минут назад

Meta* выпустила ИИ-двойника человеческого мозга — он предсказывает реакции, а не мысли

Представлена TRIBE v2 — схема, которая предсказывает, как именно человеческий мозг отреагирует на любое изображение или звук. По существу, это виртуальный двойник мозга: на вход подается видеоролик, а

Samsung выпустила фирменный браузер со встроенными AI-функциями для Windows

1 час назад

Samsung выпустила фирменный браузер со встроенными AI-функциями для Windows

Samsung сообщила о релизе фирменного браузера для Windows. С его помощью пользователи устройств компании могут синхронизировать просмотр вкладок, применять хранилище паролей Samsung и пользоваться вст

Разработчик опубликовал Claude Watch — опенсорс-приложение для управления Claude Code с Apple Watch

1 час назад

Разработчик опубликовал Claude Watch — опенсорс-приложение для управления Claude Code с Apple Watch

Разработчик под никнеймом shobhit99 выпустил на GitHub инструмент Claude Watch. Это приложение, с помощью которого пользователи могут управлять сессией в Claude Code с умных часов Apple Watch. Ознаком

«Википедия» запретила применять языковые модели для написания статей

2 часа назад

«Википедия» запретила применять языковые модели для написания статей

Англоязычная «Википедия» запретила редакторам писать и переписывать статьи с помощью языковых моделей. Новое правило закрепили в редакционной политике организации. Читать далее

Apple анонсировала Apple Business — платформу, которая объединяет в себе инструменты для компаний

2 часа назад

Apple анонсировала Apple Business — платформу, которая объединяет в себе инструменты для компаний

Apple представила платформу Apple Business, которая объединяет в себе инструменты управления корпоративными устройствами, почтой, доменами, календарём и сервисами для продвижения. Запуск запланирован