Gemma 4 vs Mistral Large 3 — сравнение бенчмарков
Gemma 4 и Mistral Large 3 показывают схожие результаты на ключевых бенчмарках. Mistral Large 3 лучше в многоязычных задачах, Gemma 4 выигрывает в открытости и простоте развёртывания.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Gemma 4 от Google и Mistral Large 3 от Mistral AI — две ведущие европейско-американские открытые языковые модели. Оба предложения конкурируют в классе эффективных LLM с открытыми весами.
Mistral Large 3 показывает MMLU 84.0%, HumanEval 81.8% и MATH 71.2%, незначительно превосходя Gemma 4 (MMLU 81.2%, HumanEval 79.5%, MATH 68.4%). Разрыв минимален и может не ощущаться в повседневных задачах.
Европейские компании, которым важны GDPR и обработка европейских языков, оценят Mistral Large 3. Разработчики, предпочитающие экосистему Google и простоту развёртывания, выберут Gemma 4.
Семейство открытых мультимодальных моделей Google. 4 варианта от 2.3B до 31B. Текст, изображения, аудио, видео. 31B Dense — #3 в Arena AI. Apache 2.0, 140+ языков, function calling.
Тарифы, обзор, бенчмарки →Открытая европейская модель: MoE 675B параметров (41B активных), контекст 262K токенов, лицензия Apache 2.0. Сопоставима с GPT-4o при цене API в 4 раза ниже.
Тарифы, обзор, бенчмарки →