Зачем в Anthropic полгода делали неработающего ИИ-агента

3 мин
Зачем в Anthropic полгода делали неработающего ИИ-агента

Борис Черни, создатель Claude Code в Anthropic, на конференции Sequoia AI Ascent 2026 признал: первые полгода продукт работал у него самого только в 10% случаев. "Он едва годился к использованию. Я писал через него максимум 10% своего кода. Мы строили под следующую схема", — рассказал он в разговоре с Лорен Ридер из Sequoia. Экспоненциальный рост пользователей начался только в мае 2025 года, с выходом Opus 4 — то есть спустя приблизительно полгода после публичного релиза самого Claude Code.

Сам Черни описал это как осознанную стратегию — product overhang, расчет на способности модели, которых еще нет. На старте команда увидела: Sonnet 3.5 уже умнее, чем модели, которые использовались в редакторах редакторы с автодополнением кода — а значит, можно начинать строить агента. Но под полноценного агента, который пишет код целиком, даже Sonnet 3.5 не дотягивал. Поэтому целились в следующее поколение — а ждать его пришлось приблизительно полугода.

Картина изменилась с Opus 4 в мае 2025 года. Каждый второй релиз — 4.5, 4.6, 4.7 — давал новый виток роста. И в этом, по словам Черни, главный операционный вывод для команды: горизонт планирования — приблизительно недели. Второй релиз модели может сделать ключевую фичу ненужной или, наоборот, превратить недоделанный продукт в полностью рабочий.

Когда Ридер спросила Черни, что он стал бы делать сегодня, зная, что PMF (product-market fit, момент, когда продукт начинает массово находить аудиторию) придется ждать полгода, тот назвал три направления: Claude Design — агент для дизайна на основе computer use (режим, где модель видит экран и сама управляет курсором и клавиатурой); более глубокая работа с циклами и batch-обработкой (Message Batches программный интерфейс, через который можно асинхронно отправлять пакеты запросов и получать ответы дешевле); и сам computer use как продукт. По словам Черни, все три направления "уже сейчас вполне неплохо работают" — и станут "сильно лучше" по мере развития моделей.

Еще один прогноз Черни — через год сам Claude Code может сократиться до 100 строк кода. Сейчас в агенте "руками" реализованы безопасность от prompt injection (попыток подсунуть модели команды через входные данные), статическая проверка bash-команд перед запуском, режимы разрешений и точки, где требуется подтверждение человека. Все четыре — страховки на случай, что схема сделает что-то не так. По словам Черни, по мере того как модели становятся надежнее, обвязка становится тоньше — и в какой-то момент окажется, что "схема просто делает правильно", и страховки больше не нужны.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Notion открыла платформу для внешних AI-агентов и кастомной логики внутри workspace

19 минут назад

Notion открыла платформу для внешних AI-агентов и кастомной логики внутри workspace

Notion продолжает двигаться от приложения для заметок и баз знаний к платформе, где люди, информация и AI-агенты работают в одном workspace. Компания представила Notion Developer Platform — набор инст

ФБР удалённо исправило DNS-настройки взломанных роутеров TP-Link в США

22 минуты назад

ФБР удалённо исправило DNS-настройки взломанных роутеров TP-Link в США

Минюст США и ФБР сообщили о судебно санкционированной операции против сети домашних и офисных роутеров, которую использовала российская группировка APT28, также известная как Fancy Bear и Forest Blizz

Waymo обучит роботакси не выезжать на затопленные улицы

23 минуты назад

Waymo обучит роботакси не выезжать на затопленные улицы

Waymo отзывает приблизительно 3,8 тыс. роботакси в США для устранения неполадок программного обеспечения, которые позволяли автомобилям компании выезжать на затопленные улицы, следует из письма на сай

От требований ФСТЭК к внедрению 2FA: вебинар МУЛЬТИФАКТОР

42 минуты назад

От требований ФСТЭК к внедрению 2FA: вебинар МУЛЬТИФАКТОР

Ваша ИТ-инфраструктура — это фундамент бизнеса, а её защита — основной приоритет. Но требования ФСТЭК становятся жёстче, а свежий приказ № 117 буквально не оставляет права на ошибку… Как в этих услови

Центральный университет открыл шесть научных лабораторий в области глубоких технологий

49 минут назад

Центральный университет открыл шесть научных лабораторий в области глубоких технологий

Центральный университет запустил шесть научных лабораторий в области DeepTech. Они будут функционировать в ключевых областях современных исследований, таких как интеллектуальные сенсорные системы, выч