
14 апреля 2026, 11:42
ИИ пишет исходник на уровне людей, но не умеет ознакомиться часы: Стэнфорд опубликовал AI Index 2026
Stanford HAI 13 апреля выпустил девятый ежегодный отчет AI Index — 423 страницы цифр, графиков и бенчмарков, по которым индустрия сверяется весь следующий год. Главный тезис 2026 года — разрыв между т

12 апреля 2026, 14:39
Почему Claude Code «отупел» после февраля? Доклад на 6852 сессиях
Директор группы AI в AMD Стелла Лауренцо опубликовала на GitHub разбор работы Claude Code за три месяца — с января по март 2026 года. В основе — 6852 сессии, 234 760 вызовов инструментов и почти 18 ты

9 апреля 2026, 20:28
Разработчик рассказал, как его «газлайтила» Claude Code — она сама пишет инструкции и утверждает, что их дал человек
Разработчик Гарет Дуайер рассказал о баге, который он называет "худшим из всех, что видел у LLM-провайдера". Суть простая: Claude в Claude Code иногда генерирует сам себе сообщения во внутренних рассу

5 апреля 2026, 19:04
Выбросил месяц ИИ-кода и стартовал заново: инженер Google честно рассказал о работе с Claude Code
Лалит Маганти, инженер Google и мейнтейнер проекта Perfetto, опубликовал детальный разбор того, как за ~250 часов и три месяца работы с Claude Code разработал syntaqlite — набор devtools для SQLite, в

4 апреля 2026, 23:54
Claude Code нашел 23-летний дефект в Linux
Николас Карлини, исследователь из Anthropic, рассказал на конференции [un]prompted 2026, что с помощью Claude Code обнаружил несколько удаленно эксплуатируемых уязвимостей в ядре Linux. Одна из них —

30 марта 2026, 11:35
В Claude Code нашли серьезный дефект — он молча сбрасывает исходник каждые 10 минут
Разработчик обнаружил, что Claude Code версии 2.1.87 на macOS каждые 10 минут выполняет скрытую операцию git fetch origin + git reset --hard origin/main в рабочем репозитории проекта. Это молча уничто

29 марта 2026, 19:30
Amazon научил ИИ-агентов эволюционировать: 3 строки кода и первое место на бенчмарке
Исследователи Amazon и Университета Пенсильвании выпустили open-source фреймворк A-Evolve, который превращает базового ИИ-агента в топового — автоматически, без ручной настройки. Платформа берет обычн

28 марта 2026, 12:53
GLM-5.1 — китайский кодинг-агент, который стоит попробовать
Пока Anthropic бодается с OpenAI, китайцы продолжают дышать в спину. Zhipu AI дропнул модель, которая в Claude Code показывает 94.6% от Opus 4.6 - за $3 в месяц. Обучена полностью на Huawei Ascend, бе

27 марта 2026, 23:00
Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Свежий тест производительности стравил 15 моделей
Исследователь Лех Мазур опубликовал LLM Persuasion Benchmark — тест производительности, в котором 15 языковых моделей спорят друг с другом на дискуссионные темы и пытаются сдвинуть позицию оппонента.