1 час назад
«Ошеломляющий прогресс»: Карпати пояснил, почему рывок ИИ виден только в коде и математике

Один из основателей OpenAI и бывший директор по ИИ в Tesla Андрей Карпати опубликовал в X развернутый тред о "растущем разрыве" в восприятии возможностей ИИ. По его мнению, даже среди тех, кто платит $200 в месяц за топовые модели, мало кто понимает, насколько "пиковыми" стали улучшения — прогресс сконцентрировался в программировании, математике и ресерче, а типовые задачи вроде поиска, письма и советов почти не сдвинулись с места.
Карпати выделил две группы, которые, по его словам, "говорят мимо друг друга". Первая — люди, составившие мнение об ИИ по бесплатному ChatGPT годичной давности. Именно они смеются над вирусными роликами, где Advanced Voice Mode от OpenAI не может решить элементарный вопрос — например, ехать на машине или идти до автомойки, которая в 50 метрах от твоего дома. По мнению Карпати, эти устаревшие и отчасти "осиротевшие" модели не отражают того, на что способны современные агентные системы.
Вторая группа — профессионалы, которые используют Codex от OpenAI и Claude Code в программировании, математике и исследованиях. Именно они, как пишет Карпати, сильнее всего подвержены "AI-психозу": когда такой модели дают доступ к терминалу, она за час связно переструктурирует целую кодовую базу или находит и эксплуатирует уязвимости в компьютерных системах — задачи, на которые у человека ушли бы дни и недели.
Разрыв Карпати объясняет двумя техническими и экономическими причинами. Во-первых, программирование и математика идеально подходят для обучения с подкреплением (RL) на верифицируемых наградах: юнит-тест либо пройден, либо нет — в отличие от текстов, качество которых алгоритмически не измеришь. Во-вторых, именно эти задачи приносят основные деньги в b2b-сегменте, следовательно крупнейшая часть команд в AI-лабораториях сфокусирована на их улучшении.
Результат Карпати формулирует так: голосовой режим ChatGPT действительно будет тупить в мемных роликах — и ровно одновременно топовый Codex будет час напролет перестраивать чужой проект. Обе картинки верны одновременно, просто они про разные модели и разные задачи.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

15 минут назад
Go в продакшене: архитектура, сети и наблюдаемость. Приглашаем на Я.Субботник
25 апреля встречаемся в офисе Яндекса в Санкт-Петербурге и в интернете, чтобы обсудить всё, что волнует Go-сообщество: от интеграций и консистентности данных до сетевой инфраструктуры и observability

23 минуты назад
Корпоратив в аду: как организация Plex устроила тимбилдинг в стиле шоу Survivor
Организация Plex организовала корпоративный выезд для сотрудников в стиле реалити-шоу Survivor. Корпоратив, который проходил в Гондурасе и обошёлся в полмиллиона долларов, превратился в кошмар: сотруд

26 минут назад
Газпромбанк модернизировал интернет-банк и мобильное программа
Газпромбанк обновил интернет-банк и мобильное программа Обновленная релиз для iOS уже доступна в App Store под названием «Цифровой сейф». Читать далее

52 минуты назад
Исследование: работодатели используют личные информация для вычисления минимальной зарплаты, на которую согласятся сотрудники
Работодатели собирают личные информация потенциальных работников и используют их для вычисления минимальной зарплаты, на которую готовы согласиться соискатели. Такие инструменты анализируют эффективно

2 часа назад
«Самая способная кибермодель, которую мы оценивали»: британские власти созывают совещание в связи с Claude Mythos
Британские финансовые регуляторы собирают экстренное межведомственное совещание из-за новой модели Anthropic — Claude Mythos. По данным Financial Times, на встрече на этой неделе соберутся представите