16 апреля 2026, 18:06

Вышел Claude Opus 4.7 — втрое лучше видит, строже слушает инструкции

3 мин

Anthropic выпустила Claude Opus 4.7 — новую флагманскую схема общего доступа, которая заметно подтянулась в программировании, зрении и следовании инструкциям. Цена осталась прежней: $5 за миллион входных токенов и $25 за миллион выходных. В программный оболочку модель доступна под строкой claude-opus-4-7, а также через Amazon Bedrock, Google Vertex AI и Microsoft Foundry. Anthropic отдельно предупреждает, что расход токенов на тех же задачах может вырасти.

Главный технический скачок — зрение. Opus 4.7 принимает изображения до 2576 пикселей по длинной стороне (приблизительно 3,75 мегапикселя) — это более чем в три раза больше, чем у прежних Claude-моделей. На визуальном бенчмарке компании XBOW, которая делает автономные пентесты, модель показала 98,5% против 54,5% у Opus 4.6. Лучше видит — лучше работает с плотными скриншотами для computer-use агентов, схемами, диаграммами и документами. Следование инструкциям тоже стало строже: Anthropic прямо предупреждает: промпты под старые модели могут начать работать иначе — Opus 4.7 понимает формулировки буквально там, где предшественники пропускали части задания.

В кодинге улучшения подтверждают внешние тестировщики. У GitHub — плюс 13% на внутреннем бенчмарке из 93 задач, в том числе четыре, которые не решали ни Opus 4.6, ни Sonnet 4.6. У Cursor — 70% на CursorBench против 58 процентов у Opus 4.6. Notion отчитался о росте в 14% при меньшем расходе токенов и тройном сокращении ошибок в вызовах инструментов. Rakuten на своем внутреннем SWE-Bench закрыл в три раза больше production-задач. Vercel отметил новое поведение, которого не было у прошлых Claude: схема строит доказательства корректности перед тем, как взяться за системный исходник.

Наряду с моделью Anthropic запустила три вещи на стороне продукта. В api появился новый уровень усилий xhigh— между high и max, а также публичная бета task budgets для управления расходом токенов на длинных прогонах. В Claude Code дефолтный уровень усилий подняли до xhigh для всех тарифов, добавили команду /ultrareview для отдельной сессии ревью кода (Pro и Max дают три бесплатных использования) и расширили auto mode на Max-подписчиков.

Отдельный сюжет — позиционирование. Opus 4.7 — не самая мощная схема Anthropic: над ним стоит закрытая Claude Mythos Preview, которую компания раздала ограниченному кругу партнеров в контексте Project Glasswing и пока не выпускает публично из-за слишком сильных киберспособностей. В анонсе Anthropic прямо пишет, что во время обучения Opus 4.7 экспериментировала с дифференциальным снижением киберспособностей — то есть намеренно ослабила модель в этой области. На Opus 4.7 теперь обкатывают новые защиты, которые автоматически блокируют запросы с признаками запрещенного или высокорискового использования. Если тесты будут успешны, то со временем компания выпустит Mythos в общий доступ.

Важное, что стоит держать в уме: цена за токен не изменилась, но счет за те же задачи может вырасти. У Opus 4.7 обновлённый токенизатор, в связи с которого тот же вход мапится в 1,0–1,35× больше токенов в зависимости от типа контента. Плюс на высоких уровнях усилий схема генерирует больше рассуждений, особенно на поздних этапах агентских сценариев.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Claude Code Claude Opus 4.7 Claude Opus

Читают сейчас

3 часа назад

Work Louder и OpenAI выпустили Codex Micro — макропад для управления AI-агентами в Codex

OpenAI совместно с компание Work Louder выпустила Codex Micro — макропад, с помощью которого можно управлять AI-агентами в Codex. Девайс даёт возможность отслеживать состояние задач, запускать сценари

6 часов назад

Boston Dynamics тестирует робота‑собаку Spot для доставки посылок на «последней миле»

Компания Boston Dynamics начала испытания робота‑собаки Spot в качестве помощника для курьеров в новом сценарии. Робота адаптируют для доставки небольших отправлений от автомобиля до двери клиента — э

6 часов назад

DeepSeek готовится к IPO: оценка компании выросла до $71 млрд

Знаете, что общего у DeepSeek и ракеты? И то, и другое стартует стремительно и с оглушительным шумом. Китайский ИИ-разработчик, который в начале 2025 года перевернул рынок своей дешёвой и мощной модел

7 часов назад

Samsung представила технологию Flex Titanium для складных дисплеев Galaxy

Samsung Display анонсировала новую технологию Flex Titanium, которая будет использоваться в следующем поколении складных смартфонов Galaxy. По заявлению компании, новая конструкция дисплея должна сдел

7 часов назад

Регуляторы Китая разрешили Apple запустить ИИ‑платформу Apple Intelligence на рынки страны

Компания Apple получила одобрение китайских регуляторов на запуск платформы Apple Intelligence в материковом Китае. Как говорит Bloomberg, Государственная канцелярия интернет‑пространства КНР (CAC) вк