OpenAI готовит к релизу двунаправленную аудиомодель

2 мин
OpenAI готовит к релизу двунаправленную аудиомодель

Компания OpenAI ведет разработку инновационной двунаправленной (BiDi) аудиомодели, которая сделает диалог с искусственным интеллектом максимально похожим на человеческий. В отличие от текущих систем, новая техника позволяет ИИ обрабатывать речь непрерывно и мгновенно реагировать на изменения в процессе беседы.

ТТехника BiDi: конец эпохи пошаговых диалогов

Суть новой двунаправленной (BiDi) обработки звука заключается в непрерывном анализе входящего аудиопотока. В отличие от существующих пошаговых систем, где искусственный интеллект ожидает окончания фразы пользователя, BiDi-модель адаптируется к изменениям в режиме реального времени. Подобная архитектура даёт возможность алгоритму мгновенно корректировать ответ, если собеседник перебивает его или меняет тему разговора. Исследователи OpenAI отмечают, что текущие аудиомодели уступают текстовым решениям в точности и скорости, из-за чего большинство пользователей ChatGPT предпочитает текстовый оболочку голосовому.

Проблемы разработки и новые сроки запуска

В процессе тестирования прототипов инженеры столкнулись с техническими сбоями: схема начинает работать некорректно спустя несколько минут диалога. По этой причине запускание технологии перенесли с первого квартала 2026 года на следующий квартал или более поздний дедлайн. Данная задержка продолжает историю сложностей OpenAI с аудиопродуктами. Ранее добавление режима Advanced Voice Mode для GPT-4o откладывалось для доработки инфраструктуры и систем безопасности. В процессе ранних тестов специалисты фиксировали ошибки, включая имитацию голоса пользователя и неожиданные выкрики системы. Сегодня разработчики сосредоточены на способности модели обнаруживать и отклонять нежелательный контент.

Аппаратное будущее и экосистема устройств OpenAI

РСоздание новой модели является частью стратегии OpenAI по выходу на сегмент потребительской электроники. Компания планирует представить персональное аудиоустройство на протяжении года, а в дальнейшем расширить портфель за счет умных колонок и очков. Для интеграции в гаджеты и автомобили ведется создание облегченных моделей, способных обрабатывать аудио локально. Это позволит снизить затраты по сравнению с облачными вычислениями, следуя примеру Google, использующей схема Gemini Nano в смартфонах Pixel. Для ускорения работ руководство OpenAI объединило команды инженеров, исследователей и продуктологов в единую группу, сфокусированную на аудиорешениях.

Читают сейчас

Представлен публике инициатива KillerPDF — редактор PDF с открытым исходным кодом для Windows 10/11

52 минуты назад

Представлен публике инициатива KillerPDF — редактор PDF с открытым исходным кодом для Windows 10/11

Разработчик под ником Steve the Killer представил открытый инициатива KillerPDF. Это бесплатный легковесный портативный редактор PDF для Windows 10/11. Исходный код решения написан на С# и опубликован

Версия Firefox 150.0

1 час назад

Версия Firefox 150.0

21 апреля 2026 года состоялся выпуск стабильной версии Firefox 150.0 с улучшениями и обновлениями, а также с исправлениями ошибок и багов, обнаруженных в прошлой стабильной версии. Выпуск проекта брау

Тим Кук покинет пост генерального директора Apple, а его место займёт Джон Тернус

5 часов назад

Тим Кук покинет пост генерального директора Apple, а его место займёт Джон Тернус

Пресс-служба Apple сообщила, что Тим Кук покидает пост генерального директора компании. Его заменит Джон Тернус — старший вице-президент по компьютерной инженерии, курирующий разработку Mac, iPad, Air

Тим Кук покидает пост Apple. Свежий глава — «отец» Apple Silicon Джон Тернус

5 часов назад

Тим Кук покидает пост Apple. Свежий глава — «отец» Apple Silicon Джон Тернус

Apple в начальный раз за 15 лет меняет генерального директора: с 1 сентября 2026 года компанию возглавит Джон Тернус, старший вице-президент по аппаратной инженерии, а Тим Кук перейдет на пост исполни

Для Mac на базе Intel последней поддерживаемой ОС станет macOS 26 Tahoe

5 часов назад

Для Mac на базе Intel последней поддерживаемой ОС станет macOS 26 Tahoe

На конференции WWDC 2025 организация Apple сообщила, что macOS 26 Tahoe — это последняя версия macOS, которую будут поддерживать компьютеры Mac на базе процессоров Intel. Ознакомиться далее