«Ошеломляющий прогресс»: Карпати пояснил, почему рывок ИИ виден только в коде и математике

2 мин
«Ошеломляющий прогресс»: Карпати пояснил, почему рывок ИИ виден только в коде и математике

Один из основателей OpenAI и бывший директор по ИИ в Tesla Андрей Карпати опубликовал в X развернутый тред о "растущем разрыве" в восприятии возможностей ИИ. По его мнению, даже среди тех, кто платит $200 в месяц за топовые модели, мало кто понимает, насколько "пиковыми" стали улучшения — прогресс сконцентрировался в программировании, математике и ресерче, а типовые задачи вроде поиска, письма и советов почти не сдвинулись с места.

Карпати выделил две группы, которые, по его словам, "говорят мимо друг друга". Первая — люди, составившие мнение об ИИ по бесплатному ChatGPT годичной давности. Именно они смеются над вирусными роликами, где Advanced Voice Mode от OpenAI не может решить элементарный вопрос — например, ехать на машине или идти до автомойки, которая в 50 метрах от твоего дома. По мнению Карпати, эти устаревшие и отчасти "осиротевшие" модели не отражают того, на что способны современные агентные системы.

Вторая группа — профессионалы, которые используют Codex от OpenAI и Claude Code в программировании, математике и исследованиях. Именно они, как пишет Карпати, сильнее всего подвержены "AI-психозу": когда такой модели дают доступ к терминалу, она за час связно переструктурирует целую кодовую базу или находит и эксплуатирует уязвимости в компьютерных системах — задачи, на которые у человека ушли бы дни и недели.

Разрыв Карпати объясняет двумя техническими и экономическими причинами. Во-первых, программирование и математика идеально подходят для обучения с подкреплением (RL) на верифицируемых наградах: юнит-тест либо пройден, либо нет — в отличие от текстов, качество которых алгоритмически не измеришь. Во-вторых, именно эти задачи приносят основные деньги в b2b-сегменте, следовательно крупнейшая часть команд в AI-лабораториях сфокусирована на их улучшении.

Результат Карпати формулирует так: голосовой режим ChatGPT действительно будет тупить в мемных роликах — и ровно одновременно топовый Codex будет час напролет перестраивать чужой проект. Обе картинки верны одновременно, просто они про разные модели и разные задачи.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Go в продакшене: архитектура, сети и наблюдаемость. Приглашаем на Я.Субботник

15 минут назад

Go в продакшене: архитектура, сети и наблюдаемость. Приглашаем на Я.Субботник

25 апреля встречаемся в офисе Яндекса в Санкт-Петербурге и в интернете, чтобы обсудить всё, что волнует Go-сообщество: от интеграций и консистентности данных до сетевой инфраструктуры и observability

Корпоратив в аду: как организация Plex устроила тимбилдинг в стиле шоу Survivor

23 минуты назад

Корпоратив в аду: как организация Plex устроила тимбилдинг в стиле шоу Survivor

Организация Plex организовала корпоративный выезд для сотрудников в стиле реалити-шоу Survivor. Корпоратив, который проходил в Гондурасе и обошёлся в полмиллиона долларов, превратился в кошмар: сотруд

Газпромбанк модернизировал интернет-банк и мобильное программа

26 минут назад

Газпромбанк модернизировал интернет-банк и мобильное программа

Газпромбанк обновил интернет-банк и мобильное программа Обновленная релиз для iOS уже доступна в App Store под названием «Цифровой сейф». Читать далее

Исследование: работодатели используют личные информация для вычисления минимальной зарплаты, на которую согласятся сотрудники

52 минуты назад

Исследование: работодатели используют личные информация для вычисления минимальной зарплаты, на которую согласятся сотрудники

Работодатели собирают личные информация потенциальных работников и используют их для вычисления минимальной зарплаты, на которую готовы согласиться соискатели. Такие инструменты анализируют эффективно

«Самая способная кибермодель, которую мы оценивали»: британские власти созывают совещание в связи с Claude Mythos

2 часа назад

«Самая способная кибермодель, которую мы оценивали»: британские власти созывают совещание в связи с Claude Mythos

Британские финансовые регуляторы собирают экстренное межведомственное совещание из-за новой модели Anthropic — Claude Mythos. По данным Financial Times, на встрече на этой неделе соберутся представите