Llama 4 Maverick vs Mistral Large 3 — сравнение бенчмарков

Llama 4 Maverick

Бенчмарки

MMLU

Llama

88.2

Mistral

84.7

HumanEval (код)

Llama

82.4

Mistral

79.3

GSM8K (математика)

Llama

91.3

Mistral

88.1

Arena Elo

Llama

1287

Mistral

1261

Средний балл: Llama 387.2vsMistral 378.3

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Llama 4 Maverick

Meta

Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.

Тарифы, обзор, бенчмарки →

Mistral Large 3

Mistral AI

Открытая европейская модель: MoE 675B параметров (41B активных), контекст 262K токенов, лицензия Apache 2.0. Сопоставима с GPT-4o при цене API в 4 раза ниже.

Тарифы, обзор, бенчмарки →

Llama 4 Maverick vs Mistral Large 3 — сравнение бенчмарков

Бенчмарки

Вопросы и ответы

Llama 4 Maverick vs Mistral Large 3 — сравнение бенчмарков

Бенчмарки

Вопросы и ответы