2 часа назад
Вышел Claude Opus 4.7 — втрое лучше видит, строже слушает инструкции

Anthropic выпустила Claude Opus 4.7 — новую флагманскую схема общего доступа, которая заметно подтянулась в программировании, зрении и следовании инструкциям. Цена осталась прежней: $5 за миллион входных токенов и $25 за миллион выходных. В программный оболочку модель доступна под строкой claude-opus-4-7, а также через Amazon Bedrock, Google Vertex AI и Microsoft Foundry. Anthropic отдельно предупреждает, что расход токенов на тех же задачах может вырасти.
Главный технический скачок — зрение. Opus 4.7 принимает изображения до 2576 пикселей по длинной стороне (приблизительно 3,75 мегапикселя) — это более чем в три раза больше, чем у прежних Claude-моделей. На визуальном бенчмарке компании XBOW, которая делает автономные пентесты, модель показала 98,5% против 54,5% у Opus 4.6. Лучше видит — лучше работает с плотными скриншотами для computer-use агентов, схемами, диаграммами и документами. Следование инструкциям тоже стало строже: Anthropic прямо предупреждает: промпты под старые модели могут начать работать иначе — Opus 4.7 понимает формулировки буквально там, где предшественники пропускали части задания.
В кодинге улучшения подтверждают внешние тестировщики. У GitHub — плюс 13% на внутреннем бенчмарке из 93 задач, в том числе четыре, которые не решали ни Opus 4.6, ни Sonnet 4.6. У Cursor — 70% на CursorBench против 58 процентов у Opus 4.6. Notion отчитался о росте в 14% при меньшем расходе токенов и тройном сокращении ошибок в вызовах инструментов. Rakuten на своем внутреннем SWE-Bench закрыл в три раза больше production-задач. Vercel отметил новое поведение, которого не было у прошлых Claude: схема строит доказательства корректности перед тем, как взяться за системный исходник.
Наряду с моделью Anthropic запустила три вещи на стороне продукта. В api появился новый уровень усилий xhigh— между high и max, а также публичная бета task budgets для управления расходом токенов на длинных прогонах. В Claude Code дефолтный уровень усилий подняли до xhigh для всех тарифов, добавили команду /ultrareview для отдельной сессии ревью кода (Pro и Max дают три бесплатных использования) и расширили auto mode на Max-подписчиков.
Отдельный сюжет — позиционирование. Opus 4.7 — не самая мощная схема Anthropic: над ним стоит закрытая Claude Mythos Preview, которую компания раздала ограниченному кругу партнеров в контексте Project Glasswing и пока не выпускает публично из-за слишком сильных киберспособностей. В анонсе Anthropic прямо пишет, что во время обучения Opus 4.7 экспериментировала с дифференциальным снижением киберспособностей — то есть намеренно ослабила модель в этой области. На Opus 4.7 теперь обкатывают новые защиты, которые автоматически блокируют запросы с признаками запрещенного или высокорискового использования. Если тесты будут успешны, то со временем компания выпустит Mythos в общий доступ.
Важное, что стоит держать в уме: цена за токен не изменилась, но счет за те же задачи может вырасти. У Opus 4.7 обновлённый токенизатор, в связи с которого тот же вход мапится в 1,0–1,35× больше токенов в зависимости от типа контента. Плюс на высоких уровнях усилий схема генерирует больше рассуждений, особенно на поздних этапах агентских сценариев.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

23 минуты назад
Вышел Claude Opus 4.7. Схема уже доступна в Veai для JetBrains IDE
Anthropic выпустили Claude Opus 4.7. Новая модель сосредоточена на агентных и инженерных задачах. Cursor зафиксировал увеличение с 58% до 70% на своём бенчмарке, CodeRabbit — улучшение recall на 10% п

1 час назад
Google предлагает скидку 50% на YouTube Premium подписчикам Google One, которые тратят от $10 в месяц
Google предлагает скидку 50% на подписку YouTube Premium на год подписчикам Google One, которые тратят $10 в месяц или больше. Акция действует в США, Канаде, Бразилии, Германии, Франции и Японии до 29

2 часа назад
Anthropic выпустила Claude Opus 4.7
Компания Anthropic представила новую версию своей флагманской модели Claude Opus 4.7. Апдейт направлено на усовершенствование качества работы в профессиональных сценариях, а не просто на рост бенчмарк

2 часа назад
Anthropic выпустили Claude Opus 4.7
Сегодня Anthropic объявила о выходе Claude Opus 4.7. Схема стала заметным шагом вперёд в программировании: в тестах на реальных задачах Cursor зафиксировал рост с 58% до 70%, CodeRabbit отметил усовер

2 часа назад
Хакеры взломали крипторублёвую биржу Grinex и похитили более 1 млрд рублей
Крипторублёвая биржа Grinex, обеспечивающая расчёты между российскими бизнесами и гражданами, сообщила о взломе. Хакеры похитили более 1 млрд рублей с кошельков биржи. Ознакомиться далее