Все сравнения

Llama 4 Maverick vs Mistral Large 3 — сравнение бенчмарков

Llama 4 Maverick

Llama 4 Maverick опережает Mistral Large 3 по большинству бенчмарков. Mistral Large 3 выигрывает по европейским языкам и более строгому соблюдению инструкций.

Бенчмарки

MMLU
Llama
88.2
Mistral
84.7
HumanEval (код)
Llama
82.4
Mistral
79.3
GSM8K (математика)
Llama
91.3
Mistral
88.1
Arena Elo
Llama
1287
Mistral
1261
Средний балл: Llama 387.2vsMistral 378.3

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Вопросы и ответы

+
+
+
+