Cohere выпустила открытую схема распознавания речи Transcribe

1 мин
Cohere выпустила открытую схема распознавания речи Transcribe

Компания Cohere представила схема Cohere Transcribe — систему автоматического распознавания речи (ASR), обученную с нуля на 14 языках. Модель построена на архитектуре Conformer и насчитывает приблизительно 2 млрд параметров, что позволяет ей эффективно функционировать в сложных акустических условиях.

Transcribe справляется с задачами, которые традиционно считаются сложными для ASR: распознаёт речь при наличии фонового шума, корректно обрабатывает перекрывающиеся голоса и учитывает особенности акцентов. Это делает модель пригодной для использования в реальных сценариях, таких как звонки, интервью и многоголосые обсуждения.

По данным Cohere, схема показала рекордную точность и заняла первое место в рейтинге Hugging Face Open ASR Leaderboard. Для английского языка метрика WER составил всего 5.42 процентов, что позволило обойти такие решения, как Whisper Large v3 от OpenAI, ElevenLabs Scribe v2 и Qwen3-ASR.

Развернуть схема можно как локально, так и на edge-устройствах, либо применять через api и платформу Cohere Model Vault. Веса уже доступны на Hugging Face, что делает Transcribe одним из самых доступных и мощных open-source решений в сегменте распознавания речи.

Запускание модели подтверждает усиливающуюся конкуренцию в области ASR и тенденция на открытые решения, которые по качеству начинают обгонять закрытые модели крупных компаний.

Читают сейчас

Власти США притормозили появление GPT-5.6: доступ будут одобрять поклиентно

1 час назад

Власти США притормозили появление GPT-5.6: доступ будут одобрять поклиентно

OpenAI выпустит свою новую флагманскую схема GPT-5.6 не сразу для всех, а сначала в ограниченном превью для узкого круга партнеров — по просьбе федерального правительства США. Причем доступ к модели в

Google перестраивает обучение Gemini, чтобы догнать Anthropic. Gemini 3.5 Pro отложена на месяц

2 часа назад

Google перестраивает обучение Gemini, чтобы догнать Anthropic. Gemini 3.5 Pro отложена на месяц

Google реорганизует свою команду по ИИ-кодингу, собранную всего несколько месяцев назад, чтобы сократить отставание от Anthropic в самом прибыльном на сегодня применении — написании кода. Как говорит

«Евклид» сделал рекордный снимок центра Млечного Пути, сияющего, как россыпь бриллиантов

3 часа назад

«Евклид» сделал рекордный снимок центра Млечного Пути, сияющего, как россыпь бриллиантов

Космический телескоп «Евклид» сделал самый крупный и детализированный снимок плотно заселённого центра нашей Галактики — ослепительное изображение, на котором запечатлено 60 миллионов звёзд. Новый сни

3 часа назад

Стратегию развития цифровых платформ подготовят к февралю 2027 года с участием 11 министерств и РЭЦ

Премьер-министр России Михаил Мишустин поручил подготовить стратегию развития цифровых платформ, в том числе с участием государства. Документ должен быть готов к началу февраля 2027 года, сообщили в п

4 часа назад

Подача судебных исков к Apple в связи с удаления приложений из AppStore не имеет юридических и практических перспектив

По информации СМИ и пояснению юриста адвокатского бюро «Ольга Ренова и партнёры» Ярослава Ковалёва, подача судебных исков к американской корпорации Apple из-за удаления мобильных приложений из магазин