12 мая 2026, 16:47

Thinking Machines создаёт слушающий и говорящий ИИ

2 мин

ИИ-стартап Thinking Machines Lab, основанный бывшим техническим директором OpenAI Мирой Мурати, объявил о версия моделей взаимодействия. Они будут способны как слушать, так и говорить.

Все современные модели работают по одинаковому принципу: они выслушивают запрос, а потом отвечают. Thinking Machines пытается изменить это, создав схема, которая обрабатывает пользовательский ввод и одновременно генерирует ответ, так что это больше напоминает диалог.

Включение интерактивности в схема открывает множество возможностей, как обещает компания, включая:

бесперебойного управления диалогом. Схема неявно отслеживает, думает ли говорящий, уступает ли он, корректирует ли свою речь или приглашает к ответу;

вербальных и визуальных вставок. Модель вмешивается по мере необходимости в зависимости от контекста, а не только когда потребитель заканчивает говорить;

одновременной речи. Потребитель и схема могут говорить одновременно (например, перевод в реальном времени);

осведомлённости о времени. Схема напрямую ощущает прошедшее время;

одновременного вызова инструментов, поиска и генерации пользовательского интерфейса. Во время разговора и прослушивания пользователя схема может одновременно искать информацию, просматривать веб-страницы или генерировать пользовательский интерфейс, вплетая результаты в разговор по мере необходимости.

Организация называет подход «полнодуплексным», и компания утверждает, что её модель TML-Interaction-Small отвечает за 0,40 секунды, что примерно соответствует скорости естественного человеческого разговора и значительно быстрее, чем скорость ответа сопоставимых моделей от OpenAI и Google.

Пока это предварительная версия для исследований, а не готовый продукт, и компания не собирается выпускать её в публичный доступ. «Ограниченная предварительная версия для исследований» появится в ближайшие некоторое количество месяцев, а более широкий выпуск запланирован на конец этого года.

Для измерения качества взаимодействия модели исследователи использовали FD-bench, один из немногих существующих бенчмарков, предназначенных для измерения интерактивности. В FD-bench версии 1.5 модели предоставляется предварительно записанный аудиоматериал, и она должна реагировать в определённые моменты времени. Этот тест производительности измеряет поведение модели в нескольких сценариях: прерывание со стороны пользователя, обратный канал связи с пользователем, разговор с другими и фоновая речь. Отмечается, что TML-Interaction-Small показала хорошие результаты во всех этих областях. Для количественной оценки ИИ они применили Audio MultiChallenge, распространённый проверка, отслеживающий способность следовать инструкциям.

Осенью 2025 года Thinking Machines Lab показал свой первый продукт — средство Tinker, который автоматизирует разработка пользовательских передовых моделей искусственного интеллекта. Он позволяет тонко настраивать ряд больших и малых моделей с открытыми весами, в том числе такие как Qwen-235B-A22B.

thinking machines lab искусственный интеллект машинное обучение ии-модели интерактивность вопросы и ответы диалог стартапы

Читают сейчас

53 минуты назад

Европейский авиарегулятор потребовал проверить 16 самолётов Airbus A380 в связи с трещин в крыльях

Европейский авиарегулятор European Union Aviation Safety Agency (EASA) распорядился срочно проверить 16 самолётов Airbus A380. Причиной стали трещины в одном из элементов крыла, которые эксперты нашли

1 час назад

Binance перестанет функционировать в Европе с 1 июля

Binance перестанет функционировать в Европе со следующей недели из-за отсутствия общеевропейской лицензии. По правилам Регламента ЕС о рынках криптоактивов (MiCA), с 1 июля все платформы, работающие с

1 час назад

Вышла GPT-5.6 — мощнейшая схема, но пока не для вас

OpenAI представила новое поколение моделей GPT-5.6: флагманскую Sol, сбалансированную Terra и быструю недорогую Luna. Sol организация называет своей самой мощной моделью на сегодня. Вот только попробо

1 час назад

Вышла GPT-5.6 Sol: уровень Mythos (Fable), но дешевле по токенам

Новое семейство GPT-5.6 разбили на три тира: Sol (флагман), Terra (на уровне GPT-5.5, но вдвое дешевле) и Luna (оперативный и самый дешёвый). Цифра теперь обозначает поколение, а Sol/Terra/Luna задают

2 часа назад

Россия обозначила планы по созданию лунной АЭС и освоению ресурсов Луны

Россия планирует в ближайшие десять лет создать атомную электростанцию на Луне. Это следует из проекта указа президента «Об основах государственной политики Российской Федерации в области космической