Все сравнения

Llama 4 Maverick vs Muse Spark — сравнение бенчмарков

Llama 4 Maverick

Llama 4 Maverick превосходит Muse Spark как универсальная мощная LLM. Muse Spark — компактная модель, оптимизированная для творческих задач и работы на устройствах с ограниченными ресурсами.

Бенчмарки

MMLU
Llama
88.2
Muse
71.4
HumanEval (код)
Llama
82.4
Muse
62.3
GSM8K (математика)
Llama
91.3
Muse
74.8
Arena Elo
Llama
1287
Muse
1178
Средний балл: Llama 387.2vsMuse 346.6

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Вопросы и ответы

+
+
+
+