Gemini 3.1 Pro vs Qwen 3 — сравнение бенчмарков

Gemini 3.1 Pro

Gemini 3.1 Pro лидирует по общим бенчмаркам. Qwen 3 от Alibaba — сильный конкурент с превосходством на китайском языке и открытыми весами.

Бенчмарки

MMLU

Gemini

Qwen

HumanEval

Gemini

Qwen

Arena Elo

Gemini

1340

Qwen

1310

Средний балл: Gemini 504vsQwen 493.7

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Gemini 3.1 Pro

Google

Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.

Тарифы, обзор, бенчмарки →

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Qwen 3 сравним с Gemini 3.1 Pro?+

Да, разрыв минимален: MMLU 87 vs 88, HumanEval 84 vs 84. Qwen 3 — реальный конкурент Gemini при бесплатном open-source статусе.

Gemini лучше на русском или Qwen?+

Gemini 3.1 Pro лучше на русском. Qwen 3 оптимизирован для китайского и японского, хотя поддерживает и русский.

Qwen 3 доступен через API?+

Да, Qwen 3 доступен через Alibaba Cloud API (dashscope) и бесплатно через HuggingFace Inference API.