
28 марта 2026, 12:53
GLM-5.1 — китайский кодинг-агент, который стоит попробовать
Пока Anthropic бодается с OpenAI, китайцы продолжают дышать в спину. Zhipu AI дропнул модель, которая в Claude Code показывает 94.6% от Opus 4.6 - за $3 в месяц. Обучена полностью на Huawei Ascend, бе

27 марта 2026, 23:00
Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Свежий тест производительности стравил 15 моделей
Исследователь Лех Мазур опубликовал LLM Persuasion Benchmark — тест производительности, в котором 15 языковых моделей спорят друг с другом на дискуссионные темы и пытаются сдвинуть позицию оппонента.

26 марта 2026, 11:24
90% репозиториев с Claude Code имеют меньше 2 звезд. Это задача или новая норма?
Независимый дашборд claudescode.dev, отслеживающий все публичные коммиты с тегом Claude Code на GitHub, насчитал более 20 млн коммитов в 1,08 млн репозиториев за год с момента запуска инструмента. Но

21 марта 2026, 12:08
OpenCode: терминальный AI-агент для кодинга, которому не нужна подписка
Вчера в топ Hacker News вышел OpenCode - open-source coding agent. Сотни комментариев, форки, pull requests за несколько часов. Убийца Claude Code или очередной coding agent, про которого все забудут?

21 марта 2026, 11:34
Пентагон vs Anthropic: «вы можете выключить Claude прямо в бою»
21 марта федеральный суд Калифорнии получил от Anthropic два присяжных заявления с одним главным тезисом: нет, мы не можем "саботировать AI-инструменты во время войны. И нет, мы не знаем откуда взялос

20 марта 2026, 10:18
Claude Code Channels: управляем AI-агентом из Telegram и Discord
Anthropic выкатила Claude Code Channels - фичу, которая превращает Telegram и Discord в пульт управления вашей сессией Claude Code. Пока research preview, но уже доступно с версии v2.1.80. Теперь можн

18 марта 2026, 10:00
Галлюцинации недели: Nemotron 3 Super, DLSS 5 и агент, который заменит вашего маркетолога
У Anthropic новая малышка на миллион. Codex учится делегировать задачи субагентам, Hermes запоминает пользователей, а MCP опять хоронят. Штош.. Ознакомиться далее

10 марта 2026, 07:01
ИИ пишет исходник, но не может его поддерживать: представлен публике начальный CI-бенчмарк для ИИ-агентов
Исследователи из Alibaba Group и Университета Сунь Ятсена представили SWE-CI — первый тест производительности, оценивающий способность ИИ-агентов не просто писать исходник, а поддерживать его в долгос

7 марта 2026, 11:21
GPT-5.4 стал лучшим ИИ для вайб-кодинга
GPT-5.4 занял первое место на Vibe Code Bench v1.1 с результатом 67,42% — на 5,7 п.п. выше предыдущего лидера GPT-5.3 Codex (61,77%). Третье место — у Claude Opus 4.6 без режима рассуждений с 57,57%.