GLM-5.1 vs Gemini 3.1 Pro — сравнение бенчмарков
Gemini 3.1 Pro опережает GLM-5.1 по большинству международных бенчмарков и мультимодальным возможностям. GLM-5.1 сильнее в задачах на китайском языке.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Флагманская агентная модель для кодинга. 744B параметров MoE, 40B активных. Обучена на чипах Huawei Ascend 910B. Лидер SWE-Bench Pro (58.4%). Поддерживает 600+ итераций без деградации. MIT лицензия. Максимальный output 128K токенов.
Тарифы, обзор, бенчмарки →Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.
Тарифы, обзор, бенчмарки →