Gemini 3.1 Pro vs Qwen 3 — сравнение бенчмарков
Gemini 3.1 Pro лидирует по общим бенчмаркам. Qwen 3 от Alibaba — сильный конкурент с превосходством на китайском языке и открытыми весами.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Qwen 3 от Alibaba Cloud — самый близкий конкурент Gemini 3.1 Pro среди open-source моделей. Разрыв в MMLU составляет лишь 1 пункт (88 vs 87). На HumanEval они сравнялись — оба 84.
Qwen 3 привлекателен для азиатских рынков и стартапов: бесплатные веса, коммерческая лицензия без ограничений до 100M MAU. Gemini 3.1 Pro выигрывает интеграцией с Google Cloud, Workspace и поддержкой русского языка.
Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.
Тарифы, обзор, бенчмарки →Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.
Тарифы, обзор, бенчмарки →