Все сравнения

Llama 4 Maverick vs Mistral Large 3 — сравнение бенчмарков
Llama 4 Maverick
Llama 4 Maverick опережает Mistral Large 3 по большинству бенчмарков. Mistral Large 3 выигрывает по европейским языкам и более строгому соблюдению инструкций.
Бенчмарки
MMLU
Llama
88.2
Mistral
84.7
HumanEval (код)
Llama
82.4
Mistral
79.3
GSM8K (математика)
Llama
91.3
Mistral
88.1
Arena Elo
Llama
1287
Mistral
1261
Средний балл: Llama 387.2vsMistral 378.3
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Llama 4 Maverick
Meta
Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.
Тарифы, обзор, бенчмарки →Mistral Large 3
Mistral AI
Открытая европейская модель: MoE 675B параметров (41B активных), контекст 262K токенов, лицензия Apache 2.0. Сопоставима с GPT-4o при цене API в 4 раза ниже.
Тарифы, обзор, бенчмарки →