11 часов назад
OpenAI готовит к релизу двунаправленную аудиомодель

Компания OpenAI ведет разработку инновационной двунаправленной (BiDi) аудиомодели, которая сделает диалог с искусственным интеллектом максимально похожим на человеческий. В отличие от текущих систем, новая техника позволяет ИИ обрабатывать речь непрерывно и мгновенно реагировать на изменения в процессе беседы.
ТТехника BiDi: конец эпохи пошаговых диалогов
Суть новой двунаправленной (BiDi) обработки звука заключается в непрерывном анализе входящего аудиопотока. В отличие от существующих пошаговых систем, где искусственный интеллект ожидает окончания фразы пользователя, BiDi-модель адаптируется к изменениям в режиме реального времени. Подобная архитектура даёт возможность алгоритму мгновенно корректировать ответ, если собеседник перебивает его или меняет тему разговора. Исследователи OpenAI отмечают, что текущие аудиомодели уступают текстовым решениям в точности и скорости, из-за чего большинство пользователей ChatGPT предпочитает текстовый оболочку голосовому.
Проблемы разработки и новые сроки запуска
В процессе тестирования прототипов инженеры столкнулись с техническими сбоями: схема начинает работать некорректно спустя несколько минут диалога. По этой причине запускание технологии перенесли с первого квартала 2026 года на следующий квартал или более поздний дедлайн. Данная задержка продолжает историю сложностей OpenAI с аудиопродуктами. Ранее добавление режима Advanced Voice Mode для GPT-4o откладывалось для доработки инфраструктуры и систем безопасности. В процессе ранних тестов специалисты фиксировали ошибки, включая имитацию голоса пользователя и неожиданные выкрики системы. Сегодня разработчики сосредоточены на способности модели обнаруживать и отклонять нежелательный контент.
Аппаратное будущее и экосистема устройств OpenAI
РСоздание новой модели является частью стратегии OpenAI по выходу на сегмент потребительской электроники. Компания планирует представить персональное аудиоустройство на протяжении года, а в дальнейшем расширить портфель за счет умных колонок и очков. Для интеграции в гаджеты и автомобили ведется создание облегченных моделей, способных обрабатывать аудио локально. Это позволит снизить затраты по сравнению с облачными вычислениями, следуя примеру Google, использующей схема Gemini Nano в смартфонах Pixel. Для ускорения работ руководство OpenAI объединило команды инженеров, исследователей и продуктологов в единую группу, сфокусированную на аудиорешениях.
Читают сейчас

4 часа назад
Как Claude Opus 4.6 понял, что его тестируют и взломал ответы к бенчмарку
Anthropic опубликовала отчет о необычном поведении Claude Opus 4.6 во время прохождения BrowseComp — бенчмарка OpenAI, который проверяет способность моделей находить труднодоступную информацию в сети.

5 часов назад
OpenAI выпустила ИИ-агента для поиска уязвимостей — он уже нашел баги в OpenSSH, GnuTLS и Chromium
OpenAI запустила Codex Security — ИИ-агента для поиска уязвимостей в коде. За время закрытой беты, которая шла с прошлого года под кодовым названием Aardvark, агент просканировал более 1,2 млн коммито

8 часов назад
Крупнейшая провинция Китая планирует перестроить промышленность с помощью ИИ
Власти китайской провинции Гуандун, крупнейшего экономического региона страны, объявили о планах масштабного внедрения искусственного интеллекта в промышленность и ключевые отрасли экономики. Об этом

8 часов назад
Запущен инициатива по сохранению файлов игрового архива Myrient, дедлайн до 31 марта
26 февраля 2026 года было объявлено о закрытии одного из крупнейших собраний цифровых копий игр Myrient. Чтобы сохранить цифровое наследие, запущен инициатива Minerva Archive. Сотни энтузиастов качают

8 часов назад
OpenAI встроила ChatGPT в Excel и подключила к нему информация Bloomberg, Moody's и S&P
OpenAI официально представила новую модель GPT-5.4 и специализированный аддон ChatGPT для Excel, предназначенный для глубокой автоматизации офисной работы. ИСредство позволяет строить сложные финансов