Каталог моделей
💬 Текст💻 Код API Open Source

GLM-5.1

Zhipu AIДата выхода: 7 апр 2026Контекст: 200K tokens Сайт

Флагманская агентная модель для кодинга. 744B параметров MoE, 40B активных. Обучена на чипах Huawei Ascend 910B. Лидер SWE-Bench Pro (58.4%). Поддерживает 600+ итераций без деградации. MIT лицензия. Максимальный output 128K токенов.

Тарифы

API (OpenRouter)
$0.95/1M input
  • $3.15/1M output
  • 200K контекст
  • 128K output
Self-hosted
Бесплатно
  • MIT лицензия
  • HuggingFace

Плюсы и минусы

Плюсы

  • MIT лицензия — максимально свободная
  • Лидер SWE-Bench Pro (58.4%)
  • 600+ итераций без деградации
  • Output до 128K токенов

Минусы

  • Обучена на чипах Huawei — вопросы к NVIDIA-оптимизации
  • Пиковые часы стоят 3x
  • Фокус на коде — менее универсальна
  • Документация на китайском

Подробный обзор

Что такое GLM-5.1

GLM-5.1 — флагманская агентная модель от Zhipu AI (Z.AI), специализированная на долгосрочном инженерном кодинге. 744B параметров MoE с 40B активных на токен. Полностью обучена на чипах Huawei Ascend 910B без оборудования NVIDIA. Лицензия MIT.

Ключевые возможности

Лидер SWE-Bench Pro с результатом 58.4% — лучшая открытая модель для агентного кодинга. Способна поддерживать продуктивность на протяжении 600+ итераций оптимизации и тысяч вызовов инструментов без деградации. Максимальный output 128K токенов за один запрос.

Контекст 200K токенов. MIT лицензия — максимально свободная, без ограничений на коммерческое использование. Интеграция с Claude Code, Cline и другими IDE-инструментами.

Сравнение с конкурентами

На SWE-Bench Pro GLM-5.1 обгоняет Claude Opus 4.6 и GPT-5.4. Однако на общих задачах рассуждения уступает им — модель заточена именно под агентный кодинг. По цене ($0.95/1M input) дороже Qwen 3 ($0.05/1M), но значительно дешевле Claude Opus.

Как начать

API через bigmodel.cn или OpenRouter. Self-hosted — веса на HuggingFace и ModelScope под MIT. Подписка GLM Coding от $10/мес для IDE-интеграции.

Вопросы и ответы

Чем отличается от GLM-5?+
Специализирована на агентном кодинге, сохраняет продуктивность 600+ итераций.
Почему Huawei?+
Демонстрирует независимость от западных чипов.
Что значит агентная?+
Автономно пишет код, запускает инструменты, исправляет ошибки сотни циклов.
Бесплатно?+
Веса под MIT на HuggingFace. API платный.

Похожие модели

Текст

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

$0.05/1M input
Код

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно
Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно
Текст

Llama 4 Nemotron

NVIDIA + Meta

Доработанная NVIDIA версия Llama 4 Maverick от Meta — 17B активных параметров из 400B MoE. Лидер открытых моделей по качеству рассуждений, превосходит GPT-4o и Claude Sonnet на ключевых бенчмарках.

Бесплатно
Код

DeepSeek Coder V2

DeepSeek

Открытая модель-кодировщик от DeepSeek с архитектурой MoE на 236 млрд параметров (активны 21B), поддержка 128K контекста и 338 языков программирования.

Бесплатно

Используете GLM-5.1?

Поделитесь опытом в нашем сообществе

Написать пост