28 марта 2026, 12:53
GLM-5.1 — китайский кодинг-агент, который стоит попробовать

Пока Anthropic бодается с OpenAI, китайцы продолжают дышать в спину. Zhipu AI дропнул модель, которая в Claude Code показывает 94.6% от Opus 4.6 - за $3 в месяц. Обучена полностью на Huawei Ascend, без единого чипа Nvidia. Кратко, что это значит на практике для тех, кто вайб-кодит и полагает токены.
Вчера Zhipu AI (они же Z.ai) выкатили GLM-5.1- апдейт своей флагманской модели, заточенный конкретно под кодинг. По их внутреннему бенчмарку через Claude Code схема набрала 45.3 балла против 47.9 у Opus 4.6, то есть 94.6% от топа. А по сравнению с базовым GLM-5, который вышел в феврале, это прирост на 28% - с 35.4 до 45.3. SWE-bench Verified у базы - 77.8, что уже было лучшим среди открытых моделей. Важный нюанс: бенчмарки пока чисто китайские, независимой верификации еще нет, так что числа стоит воспринимать на веру.
Как подключить к Claude Code
Для вайб-кодинга главное что? Правильно - практика и бесконечные деньги на токены. GLM-5.1 работает прямо через Claude Code, достаточно подправить ~/.claude/settings.json, прописав в env переменных ANTHROPIC_BASE_URL на эндпоинт Z.ai и свой api-ключ. Модель маппится на Opus. Есть даже CLI-обёртка glm на GitHub, которая делает это через временные env-переменные, не трогая ваш основной конфиг - удобно, если хотите держать и Anthropic, и GLM параллельно. Для пользователей Max-плана GLM-5.1 нужно явно прописать "glm-5.1" в маппинге. Подробная инструкция здесь, в официальной документации.
Экономика токенов
Теперь про деньги, потому что для нас, вайб-кодеров, это один из решающих факторов. GLM Coding Plan стартует от $3/мес (промо, 120 промптов) до $30/мес за Pro. Сравните с Claude Max за $100–200. api отдельно: $1.00 за миллион входных токенов и $3.20 за выходные, что в разы дешевле западных гигантов. Если вы прототипируете, экспериментируете, гоняете агентов на повторяющихся задачах - экономию вы точно почувствуете. Особенно когда у Opus в пиковые часы растет латенси и очереди.
Что за схема
Не обязательная часть для простых любителей вайбкодинга. Архитектурно - MoE на 744B параметров с 40B активными на токен, контекст 200K, DeepSeek Sparse Attention для эффективной работы с длинными контекстами. Из необычного и интересного: вся семейка GLM-5 обучена полностью на 100 000 чипах Huawei Ascend 910B, без единого GPU от Nvidia (импортозамещено, получается?). Для тех, кто поднимает свои инстансы - веса открыты под MIT, деплоить можно через vLLM, SGLang. Техрепорт: «GLM-5: from Vibe Coding to Agentic Engineering».
Итог
Если вы кодите на открытых моделях или ищете запасной вариант, когда Claude тормозит, лимиты кончились, или нужна альтернатива без санкционных рисков - GLM-5.1 стоит рассмотреть и протестировать. Не призываю заменить Opus - лишь как модель следующий очереди в вашем рабочем стеке: разница в 2.6 балла от Opus на практике часто не заметна, а по цене разница еще как заметна.
Полезные ссылки:
Надеюсь тебе понравилось. Лучшая благодарность — это твоя подписка на мой Telegram-канал 😊
Читают сейчас

1 час назад
Европейский авиарегулятор потребовал проверить 16 самолётов Airbus A380 в связи с трещин в крыльях
Европейский авиарегулятор European Union Aviation Safety Agency (EASA) распорядился срочно проверить 16 самолётов Airbus A380. Причиной стали трещины в одном из элементов крыла, которые эксперты нашли

2 часа назад
Binance перестанет функционировать в Европе с 1 июля
Binance перестанет функционировать в Европе со следующей недели из-за отсутствия общеевропейской лицензии. По правилам Регламента ЕС о рынках криптоактивов (MiCA), с 1 июля все платформы, работающие с

2 часа назад
Вышла GPT-5.6 — мощнейшая схема, но пока не для вас
OpenAI представила новое поколение моделей GPT-5.6: флагманскую Sol, сбалансированную Terra и быструю недорогую Luna. Sol организация называет своей самой мощной моделью на сегодня. Вот только попробо

2 часа назад
Вышла GPT-5.6 Sol: уровень Mythos (Fable), но дешевле по токенам
Новое семейство GPT-5.6 разбили на три тира: Sol (флагман), Terra (на уровне GPT-5.5, но вдвое дешевле) и Luna (оперативный и самый дешёвый). Цифра теперь обозначает поколение, а Sol/Terra/Luna задают
2 часа назад
Россия обозначила планы по созданию лунной АЭС и освоению ресурсов Луны
Россия планирует в ближайшие десять лет создать атомную электростанцию на Луне. Это следует из проекта указа президента «Об основах государственной политики Российской Федерации в области космической