GLM-5.1 — китайский кодинг-агент, который стоит попробовать

3 мин
GLM-5.1 — китайский кодинг-агент, который стоит попробовать

Пока Anthropic бодается с OpenAI, китайцы продолжают дышать в спину. Zhipu AI дропнул модель, которая в Claude Code показывает 94.6% от Opus 4.6 - за $3 в месяц. Обучена полностью на Huawei Ascend, без единого чипа Nvidia. Кратко, что это значит на практике для тех, кто вайб-кодит и полагает токены.

Вчера Zhipu AI (они же Z.ai) выкатили GLM-5.1- апдейт своей флагманской модели, заточенный конкретно под кодинг. По их внутреннему бенчмарку через Claude Code схема набрала 45.3 балла против 47.9 у Opus 4.6, то есть 94.6% от топа. А по сравнению с базовым GLM-5, который вышел в феврале, это прирост на 28% - с 35.4 до 45.3. SWE-bench Verified у базы - 77.8, что уже было лучшим среди открытых моделей. Важный нюанс: бенчмарки пока чисто китайские, независимой верификации еще нет, так что числа стоит воспринимать на веру.

Как подключить к Claude Code

Для вайб-кодинга главное что? Правильно - практика и бесконечные деньги на токены. GLM-5.1 работает прямо через Claude Code, достаточно подправить ~/.claude/settings.json, прописав в env переменных ANTHROPIC_BASE_URL на эндпоинт Z.ai и свой api-ключ. Модель маппится на Opus. Есть даже CLI-обёртка glm на GitHub, которая делает это через временные env-переменные, не трогая ваш основной конфиг - удобно, если хотите держать и Anthropic, и GLM параллельно. Для пользователей Max-плана GLM-5.1 нужно явно прописать "glm-5.1" в маппинге. Подробная инструкция здесь, в официальной документации.

Экономика токенов

Теперь про деньги, потому что для нас, вайб-кодеров, это один из решающих факторов. GLM Coding Plan стартует от $3/мес (промо, 120 промптов) до $30/мес за Pro. Сравните с Claude Max за $100–200. api отдельно: $1.00 за миллион входных токенов и $3.20 за выходные, что в разы дешевле западных гигантов. Если вы прототипируете, экспериментируете, гоняете агентов на повторяющихся задачах - экономию вы точно почувствуете. Особенно когда у Opus в пиковые часы растет латенси и очереди.

Что за схема

Не обязательная часть для простых любителей вайбкодинга. Архитектурно - MoE на 744B параметров с 40B активными на токен, контекст 200K, DeepSeek Sparse Attention для эффективной работы с длинными контекстами. Из необычного и интересного: вся семейка GLM-5 обучена полностью на 100 000 чипах Huawei Ascend 910B, без единого GPU от Nvidia (импортозамещено, получается?). Для тех, кто поднимает свои инстансы - веса открыты под MIT, деплоить можно через vLLM, SGLang. Техрепорт: «GLM-5: from Vibe Coding to Agentic Engineering».

Итог

Если вы кодите на открытых моделях или ищете запасной вариант, когда Claude тормозит, лимиты кончились, или нужна альтернатива без санкционных рисков - GLM-5.1 стоит рассмотреть и протестировать. Не призываю заменить Opus - лишь как модель следующий очереди в вашем рабочем стеке: разница в 2.6 балла от Opus на практике часто не заметна, а по цене разница еще как заметна.

Полезные ссылки:

Надеюсь тебе понравилось. Лучшая благодарность — это твоя подписка на мой Telegram-канал 😊

Читают сейчас

Андрей Карпати: главная задача LLM — в том, как они отвечают

41 минуту назад

Андрей Карпати: главная задача LLM — в том, как они отвечают

Сооснователь OpenAI и бывший директор AI в Tesla Андрей Карпати опубликовал в X пост, в котором назвал главное узкое место в общении с большими языковыми моделями — структура их ответа. По его мнению,

Вышла релиз открытого редактора изображений Photoflare 1.7.0

1 час назад

Вышла релиз открытого редактора изображений Photoflare 1.7.0

В начале мая 2026 года состоялся выпуск редактора изображений Photoflare 1.7.0. В этом решении разработчики которого пытаются найти оптимальный баланс между функциональностью и удобством интерфейса. И

2 часа назад

Депутат Горелкин: GitHub в России может скоро стать на 100% недоступен

Депутат по информационной политике Горелкин написал в своем Telegram: Российские авторы заметили, что GitHub всё чаще оказывается недоступен. Процент неудачных соединений с платформой, которую многие

НАСА разогнало лопасти для нового марсианского вертолёта быстрее скорости звука

2 часа назад

НАСА разогнало лопасти для нового марсианского вертолёта быстрее скорости звука

НАСА протестировало лопасти для марсианского вертолёта нового поколения и разогнало их до 1,08 Мах, достигнув сверхзвуковой скорости. Это позволит на треть увеличить грузоподъёмность марсианских возду

Meta* продлила дедлайн эксплуатации некоторых из своих серверов общего назначения с шести до семи лет из-за дефицита ОЗУ

3 часа назад

Meta* продлила дедлайн эксплуатации некоторых из своих серверов общего назначения с шести до семи лет из-за дефицита ОЗУ

Meta* продлила срок эксплуатации некоторых из своих серверов для центров обработки данных с шести до семи лет в связи с нехватки оперативной памяти, пишет Wall Street Journal со ссылкой на две служебн