GLM-5.1 — китайский кодинг-агент, который стоит попробовать

3 мин
GLM-5.1 — китайский кодинг-агент, который стоит попробовать

Пока Anthropic бодается с OpenAI, китайцы продолжают дышать в спину. Zhipu AI дропнул модель, которая в Claude Code показывает 94.6% от Opus 4.6 - за $3 в месяц. Обучена полностью на Huawei Ascend, без единого чипа Nvidia. Кратко, что это значит на практике для тех, кто вайб-кодит и полагает токены.

Вчера Zhipu AI (они же Z.ai) выкатили GLM-5.1- апдейт своей флагманской модели, заточенный конкретно под кодинг. По их внутреннему бенчмарку через Claude Code схема набрала 45.3 балла против 47.9 у Opus 4.6, то есть 94.6% от топа. А по сравнению с базовым GLM-5, который вышел в феврале, это прирост на 28% - с 35.4 до 45.3. SWE-bench Verified у базы - 77.8, что уже было лучшим среди открытых моделей. Важный нюанс: бенчмарки пока чисто китайские, независимой верификации еще нет, так что числа стоит воспринимать на веру.

Как подключить к Claude Code

Для вайб-кодинга главное что? Правильно - практика и бесконечные деньги на токены. GLM-5.1 работает прямо через Claude Code, достаточно подправить ~/.claude/settings.json, прописав в env переменных ANTHROPIC_BASE_URL на эндпоинт Z.ai и свой api-ключ. Модель маппится на Opus. Есть даже CLI-обёртка glm на GitHub, которая делает это через временные env-переменные, не трогая ваш основной конфиг - удобно, если хотите держать и Anthropic, и GLM параллельно. Для пользователей Max-плана GLM-5.1 нужно явно прописать "glm-5.1" в маппинге. Подробная инструкция здесь, в официальной документации.

Экономика токенов

Теперь про деньги, потому что для нас, вайб-кодеров, это один из решающих факторов. GLM Coding Plan стартует от $3/мес (промо, 120 промптов) до $30/мес за Pro. Сравните с Claude Max за $100–200. api отдельно: $1.00 за миллион входных токенов и $3.20 за выходные, что в разы дешевле западных гигантов. Если вы прототипируете, экспериментируете, гоняете агентов на повторяющихся задачах - экономию вы точно почувствуете. Особенно когда у Opus в пиковые часы растет латенси и очереди.

Что за схема

Не обязательная часть для простых любителей вайбкодинга. Архитектурно - MoE на 744B параметров с 40B активными на токен, контекст 200K, DeepSeek Sparse Attention для эффективной работы с длинными контекстами. Из необычного и интересного: вся семейка GLM-5 обучена полностью на 100 000 чипах Huawei Ascend 910B, без единого GPU от Nvidia (импортозамещено, получается?). Для тех, кто поднимает свои инстансы - веса открыты под MIT, деплоить можно через vLLM, SGLang. Техрепорт: «GLM-5: from Vibe Coding to Agentic Engineering».

Итог

Если вы кодите на открытых моделях или ищете запасной вариант, когда Claude тормозит, лимиты кончились, или нужна альтернатива без санкционных рисков - GLM-5.1 стоит рассмотреть и протестировать. Не призываю заменить Opus - лишь как модель следующий очереди в вашем рабочем стеке: разница в 2.6 балла от Opus на практике часто не заметна, а по цене разница еще как заметна.

Полезные ссылки:

Надеюсь тебе понравилось. Лучшая благодарность — это твоя подписка на мой Telegram-канал 😊

Читают сейчас

Microsoft сократит рекламу и рекомендации в Windows 11 для создания более «спокойной» операционной системы

13 минут назад

Microsoft сократит рекламу и рекомендации в Windows 11 для создания более «спокойной» операционной системы

В Microsoft планируют сделать Windows 11 более «спокойной». Для этого разработчики ОС сократят количество upsells — то есть рекомендаций, промо-подсказок и рекламных блоков, которые в последние годы в

В США AI-дипфейки уже стали инструментом предвыборной рекламы

28 минут назад

В США AI-дипфейки уже стали инструментом предвыборной рекламы

В США AI-сгенерированная политическая реклама быстро превращается из экзотики в обычный инструмент кампаний. Reuters пишет, что перед промежуточными выборами 2026 года партии уже используют реалистичн

Британский стартап-компания впервые зажёг плазму внутри ракетного двигателя на термоядерном синтезе

32 минуты назад

Британский стартап-компания впервые зажёг плазму внутри ракетного двигателя на термоядерном синтезе

Команда британских учёных добилась первого в истории зажигания плазмы внутри ракетного двигателя на термоядерном синтезе — это огромный шаг, который однажды может значительно ускорить путешествия по С

Эксперты «Кросс технолоджис»: Более 40% атак на ИИ-модели связаны с prompt injection

43 минуты назад

Эксперты «Кросс технолоджис»: Более 40% атак на ИИ-модели связаны с prompt injection

Эксперты «Кросс технолоджис» и Infera Security заявили, что в первом квартале 2026 года число атак, где ИИ стал частью поверхности атаки, выросло как минимум вдвое относительно тем же периодом 2025 го

Теперь можно переносить свои чаты и личную информацию из других чат-ботов в Gemini

44 минуты назад

Теперь можно переносить свои чаты и личную информацию из других чат-ботов в Gemini

В сфере чат-ботов с искусственным интеллектом сейчас идёт настоящая война за внимание потребителей. Все крупные поставщики чат-ботов стремятся увеличить число своих пользователей, и, что стало для Goo