GLM-5.2 от Z.ai: мощный ИИ для кодинга дешевле GPT-5.5
Китайский стартап Z.ai выпустил GLM-5.2 — открытую LLM, которая превосходит GPT-5.5 в задачах программирования и стоит в шесть раз меньше.
Китайский стартап Z.ai, ранее известный как Zhipu AI, представил новую большую языковую модель GLM-5.2. Эта модель с 753 миллиардами параметров разработана специально для выполнения сложных задач автономного кодирования и инженерии. GLM-5.2 уже доступна на Hugging Face, через API Z.ai и в более чем 20 сторонних средах для разработки.
Модель GLM-5.2 предлагает стабильное контекстное окно на 1 миллион токенов. Ее основные веса выпущены под неограниченной открытой лицензией MIT, что позволяет компаниям свободно загружать, настраивать и запускать модель локально или на виртуальных машинах, оплачивая только вычислительные ресурсы. Это становится особенно привлекательным вариантом, поскольку проприетарные американские модели сталкиваются с регуляторными ограничениями, как показал недавний запрет на использование Claude Fable 5. Архитектура GLM-5.2 включает оптимизацию IndexShare, которая повторно использует индексатор каждые четыре разреженных слоя внимания, сокращая вычислительные затраты на токен в 2,9 раза при максимальной длине контекста. Также модель оснащена улучшенным слоем Multi-Token Prediction (MTP) для спекулятивного декодирования, увеличивающим длину принимаемых токенов до 20%.
Z.ai также внедрила гибкие «Режимы мышления». Пользователи могут переключать уровень логического решения задач между «Максимальным» для пиковой производительности и «Высоким», который обеспечивает баланс между производительностью и эффективностью токенов.
По результатам сторонних бенчмарков, GLM-5.2 превосходит большинство флагманских моделей с открытым исходным кодом, включая DeepSeek v4. Она также показывает результаты, близкие или превосходящие закрытые аналоги, такие как GPT-5.5 от OpenAI и Claude Opus 4.8 от Anthropic. Модель особенно сильна в использовании агентных инструментов и долгосрочных задачах по разработке программного обеспечения:
- SWE-bench Pro: GLM-5.2 набрала 62.1 балла, опередив GPT-5.5 (58.6) и своего предшественника GLM-5.1 (58.4).
- FrontierSWE (Dominance): В задачах на долгосрочное выполнение GLM-5.2 показала 74.4%, превзойдя GPT-5.5 (72.6%) и почти сравнявшись с Claude Opus 4.8 (75.1%).
- MCP-Atlas: На этой оценке использования инструментов GLM-5.2 достигла 77.0, обогнав GPT-5.5 (75.3) и немного уступив Claude Opus 4.8 (77.8).
- Humanity's Last Exam (с инструментами): С внешними инструментами GLM-5.2 набрала 54.7 балла, опередив GPT-5.5 (52.2) и немного отставая от Claude Opus 4.8 (57.9).
- PostTrainBench и SWE-Marathon: В многочасовых инженерных нагрузках GLM-5.2 стабильно превосходила GPT-5.5, набрав 34.3% против 25.0% на PostTrainBench и 13.0% против 12.0% на SWE-Marathon.
- Terminal-Bench 2.1: GLM-5.2 набрала 81.0 балла, что ниже Claude Opus 4.8 (85.0) и GPT-5.5 (84.0), но значительно выше Google Gemini 3.1 Pro (74.0).
- Design Arena: GLM-5.2 заняла первое место в этом бенчмарке с ELO 1360, обойдя даже Claude Fable 5.
Влияние новых «Режимов мышления» Z.ai заметно: «Максимальный» режим обеспечивает пиковый интеллект, но использует около 85 тысяч выходных токенов на задачу. Переключение на «Высокий» режим незначительно снижает производительность, но сокращает потребление токенов вдвое, что важно для приложений, чувствительных к задержкам.
Для разработчиков Z.ai предлагает тарифные планы GLM Coding Plan, ориентированные на рабочие процессы. Эти планы поддерживают сторонние агентные среды и инструменты, такие как Claude Code, OpenClaw, Cline, Kilo Code, Crush и Factory. Цены на годовую подписку конкурентоспособны:
- Lite: 12.60 долларов в месяц (151.20 долларов в год со второго года) для небольших репозиториев.
- Pro: 50.40 долларов в месяц для ежедневной разработки средних репозиториев, предлагает в 5 раз больше использования, чем Lite.
- Max: 112.00 долларов в месяц для больших нагрузок, предлагает в 20 раз больше использования, чем Lite, и выделенные ресурсы в часы пик.
API GLM-5.2 стоит 1.40 доллара за миллион входных токенов и 4.40 доллара за миллион выходных токенов, что делает его конкурентным на мировом рынке. Стоимость кэшированных входных данных составляет 0.26 доллара за миллион токенов, а хранение кэшированных входных данных временно бесплатно.
Сравнение цен API различных моделей (общая стоимость за 1 миллион токенов, вход + выход):
- MiMo-V2.5 Flash: 0.40 $
- deepseek-v4-flash: 0.42 $
- deepseek-v4-pro: 1.305 $
- MiniMax-M3: 1.50 $
- Gemini 3.1 Flash-Lite: 1.75 $
- Qwen3.7-Plus: 2.00 $
- MiMo-V2.5: 2.40 $
- Grok 4.3 (низкий контекст): 3.75 $
- MiMo-V2.5 Pro (≤256K): 4.00 $
- Kimi-K2.6: 4.95 $
- GLM-5.2: 5.80 $
- Grok 4.3 (высокий контекст): 7.50 $
- MiMo-V2.5 Pro (>256K): 8.00 $
- Qwen3.7-Max: 10.00 $
- Gemini 3.5 Flash: 10.50 $
- Gemini 3.1 Pro Preview (≤200K): 14.00 $
- GPT-5.4: 17.50 $
- Gemini 3.1 Pro Preview (>200K): 22.00 $
- Claude Opus 4.8: 30.00 $
- GPT-5.5: 35.00 $
- Claude Fable 5 / Claude Mythos 5: 60.00 $
Разработчики положительно встретили выпуск GLM-5.2. Команда Kilo Code подтвердила интеграцию в первый же день, отметив поддержку контекстного окна в 1 миллион токенов и режима «Максимум». Cline IDE подчеркнул, что GLM-5.2 — это первая модель с открытым исходным кодом, которая преодолела 80% на Terminal-Bench, превзойдя другие открытые модели и Gemini. Eigent AI успешно протестировал GLM-5.2 на сложных долгосрочных задачах, таких как исследование компаний и создание интерактивных отчетов.