28 марта 2026, 12:53

GLM-5.1 — китайский кодинг-агент, который стоит попробовать

3 мин

Пока Anthropic бодается с OpenAI, китайцы продолжают дышать в спину. Zhipu AI дропнул модель, которая в Claude Code показывает 94.6% от Opus 4.6 - за $3 в месяц. Обучена полностью на Huawei Ascend, без единого чипа Nvidia. Кратко, что это значит на практике для тех, кто вайб-кодит и полагает токены.

Вчера Zhipu AI (они же Z.ai) выкатили GLM-5.1- апдейт своей флагманской модели, заточенный конкретно под кодинг. По их внутреннему бенчмарку через Claude Code схема набрала 45.3 балла против 47.9 у Opus 4.6, то есть 94.6% от топа. А по сравнению с базовым GLM-5, который вышел в феврале, это прирост на 28% - с 35.4 до 45.3. SWE-bench Verified у базы - 77.8, что уже было лучшим среди открытых моделей. Важный нюанс: бенчмарки пока чисто китайские, независимой верификации еще нет, так что числа стоит воспринимать на веру.

Как подключить к Claude Code

Для вайб-кодинга главное что? Правильно - практика и бесконечные деньги на токены. GLM-5.1 работает прямо через Claude Code, достаточно подправить ~/.claude/settings.json, прописав в env переменных ANTHROPIC_BASE_URL на эндпоинт Z.ai и свой api-ключ. Модель маппится на Opus. Есть даже CLI-обёртка glm на GitHub, которая делает это через временные env-переменные, не трогая ваш основной конфиг - удобно, если хотите держать и Anthropic, и GLM параллельно. Для пользователей Max-плана GLM-5.1 нужно явно прописать "glm-5.1" в маппинге. Подробная инструкция здесь, в официальной документации.

Экономика токенов

Теперь про деньги, потому что для нас, вайб-кодеров, это один из решающих факторов. GLM Coding Plan стартует от $3/мес (промо, 120 промптов) до $30/мес за Pro. Сравните с Claude Max за $100–200. api отдельно: $1.00 за миллион входных токенов и $3.20 за выходные, что в разы дешевле западных гигантов. Если вы прототипируете, экспериментируете, гоняете агентов на повторяющихся задачах - экономию вы точно почувствуете. Особенно когда у Opus в пиковые часы растет латенси и очереди.

Что за схема

Не обязательная часть для простых любителей вайбкодинга. Архитектурно - MoE на 744B параметров с 40B активными на токен, контекст 200K, DeepSeek Sparse Attention для эффективной работы с длинными контекстами. Из необычного и интересного: вся семейка GLM-5 обучена полностью на 100 000 чипах Huawei Ascend 910B, без единого GPU от Nvidia (импортозамещено, получается?). Для тех, кто поднимает свои инстансы - веса открыты под MIT, деплоить можно через vLLM, SGLang. Техрепорт: «GLM-5: from Vibe Coding to Agentic Engineering».

Итог

Если вы кодите на открытых моделях или ищете запасной вариант, когда Claude тормозит, лимиты кончились, или нужна альтернатива без санкционных рисков - GLM-5.1 стоит рассмотреть и протестировать. Не призываю заменить Opus - лишь как модель следующий очереди в вашем рабочем стеке: разница в 2.6 балла от Opus на практике часто не заметна, а по цене разница еще как заметна.

Полезные ссылки:

Надеюсь тебе понравилось. Лучшая благодарность — это твоя подписка на мой Telegram-канал 😊

opus glm glm-5.1 vibecoding вайб-кодинг claudecode opus 4.6 ai-agents ии-агенты

Читают сейчас

58 минут назад

GPT-5.6 жульничала в тестах чаще любой модели — и проверяющих это обрадовало

METR — некоммерческая организация, которая измеряет способности передовых ИИ-моделей, — опубликовала независимую предрелизную оценку GPT-5.6 Sol, новой флагманской модели OpenAI. Основной результат ок

2 часа назад

Европейский авиарегулятор потребовал проверить 16 самолётов Airbus A380 в связи с трещин в крыльях

Европейский авиарегулятор European Union Aviation Safety Agency (EASA) распорядился срочно проверить 16 самолётов Airbus A380. Причиной стали трещины в одном из элементов крыла, которые эксперты нашли

3 часа назад

Binance перестанет функционировать в Европе с 1 июля

Binance перестанет функционировать в Европе со следующей недели из-за отсутствия общеевропейской лицензии. По правилам Регламента ЕС о рынках криптоактивов (MiCA), с 1 июля все платформы, работающие с

3 часа назад

Вышла GPT-5.6 — мощнейшая схема, но пока не для вас

OpenAI представила новое поколение моделей GPT-5.6: флагманскую Sol, сбалансированную Terra и быструю недорогую Luna. Sol организация называет своей самой мощной моделью на сегодня. Вот только попробо

3 часа назад

Вышла GPT-5.6 Sol: уровень Mythos (Fable), но дешевле по токенам

Новое семейство GPT-5.6 разбили на три тира: Sol (флагман), Terra (на уровне GPT-5.5, но вдвое дешевле) и Luna (оперативный и самый дешёвый). Цифра теперь обозначает поколение, а Sol/Terra/Luna задают