Gemma 4 vs Qwen 3 — сравнение бенчмарков
Gemma 4 — нативная мультимодальность. Qwen 3 — больше вариантов размеров и гибридное мышление.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Главное отличие
Qwen 3 сильнее в научных задачах (GPQA Diamond 88.4% vs 78%) и общем рассуждении (Arena Elo 1400 vs 1280). Gemma 4 выигрывает компактностью (31B vs 235B) и нативной мультимодальностью. MMLU-Pro одинаков.
Когда выбрать Gemma 4
Gemma 4 — лучший выбор для мультимодальных задач на ограниченном железе. Всего 31B параметров при отличном качестве. Нативная работа с изображениями, видео и текстом. Поддержка Google и экосистема Keras и JAX.
Когда выбрать Qwen 3
Qwen 3 превосходит Gemma 4 в чистой текстовой производительности и научных задачах. Широкая линейка размеров от 0.6B до 235B. Лучше для задач, где важна глубина рассуждения и точность ответов на сложные вопросы.
Семейство открытых мультимодальных моделей Google. 4 варианта от 2.3B до 31B. Текст, изображения, аудио, видео. 31B Dense — #3 в Arena AI. Apache 2.0, 140+ языков, function calling.
Тарифы, обзор, бенчмарки →Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.
Тарифы, обзор, бенчмарки →