Hume AI открыла оперативный генератор речи TADA

1 мин
Hume AI открыла оперативный генератор речи TADA

Организация Hume AI открыла исходный код TADA - системы искусственного интеллекта для генерации речи, которая синхронно обрабатывает текст и аудио. 

В отличие от предыдущих систем, которые генерировали значительно больше аудиокадров на один текстовый токен, TADA сопоставляет ровно один аудиосигнал с каждым текстовым токеном. 

По данным Hume AI, TADA работает свыше в пять раз быстрее аналогичных систем и не допускает ошибок при расшифровке - ни добавленных, ни пропущенных слов по сравнению с исходным текстом - в тестах с более чем 1000 образцов. По результатам оценки людьми система набрала 3,78 балла из 5 за естественность.

По словам представителей Hume AI, TADA достаточно компактна, чтобы работать на смартфонах, хотя при воспроизведении длинных текстов голос может периодически сбиваться. Система представлена в двух вариантах - с параметрами 1B и 3B, оба на основе Llama. 

Меньшая модель поддерживает английский язык, а релиз 3B - еще семь языков. Весь код и модели доступны на GitHub и Hugging Face под лицензией MIT, а полную техническую информацию можно найти в статье.

Читают сейчас

Организация Waymo разработала схема Reference Driver, которая послужит эталоном для сравнения систем автономного вождения

4 часа назад

Организация Waymo разработала схема Reference Driver, которая послужит эталоном для сравнения систем автономного вождения

Организация Waymo совместно с Делфтским техническим университетом разработала новую компьютерную когнитивную схема под названием ReD (Reference Driver, эталонный водитель), имитирующую человека за рул

«Амодеи отказался исправить Claude Fable 5»: в Белом доме объяснили блокировку мощнейшей модели Anthropic

7 часов назад

«Амодеи отказался исправить Claude Fable 5»: в Белом доме объяснили блокировку мощнейшей модели Anthropic

Советник Белого дома по ИИ Дэвид Сакс впервые публично и официально изложил логику администрации в споре вокруг блокировки Claude Fable 5 — в посте на X. В соответствии с заявлению Сакса, администраци

Блокировка Fable 5 оказалась временной: США обещают вернуть доступ через некоторое количество недель

10 часов назад

Блокировка Fable 5 оказалась временной: США обещают вернуть доступ через некоторое количество недель

Власти США планируют разрешить эксплуатацию моделей Claude Fable 5 и Mythos 5 уже в обозримом будущем, сообщил Axios чиновник американской администрации. По его словам, схема должна оставаться выключе

12 часов назад

Более 150 ведущих мировых математиков опубликовали «Лейденскую декларацию»

Более 150 ведущих мировых учёных в области математики опубликовали «Лейденскую декларацию». По словам её авторов, крупные технологические компании превращают фундаментальную науку в маркетинговый сред

Coinbase запустила средство для управления торговлей ИИ-агентами

13 часов назад

Coinbase запустила средство для управления торговлей ИИ-агентами

Coinbase запустила свежий финансовый средство, который даёт возможность ИИ-агентам совершать сделки и транзакции напрямую от имени пользователей. Ознакомиться далее