Llama 4 Maverick vs Muse Spark — сравнение бенчмарков

Llama 4 Maverick

Llama 4 Maverick превосходит Muse Spark как универсальная мощная LLM. Muse Spark — компактная модель, оптимизированная для творческих задач и работы на устройствах с ограниченными ресурсами.

Бенчмарки

MMLU

Llama

88.2

Muse

71.4

HumanEval (код)

Llama

82.4

Muse

62.3

GSM8K (математика)

Llama

91.3

Muse

74.8

Arena Elo

Llama

1287

Muse

1178

Средний балл: Llama 387.2vsMuse 346.6

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Llama 4 Maverick

Meta

Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.

Тарифы, обзор, бенчмарки →

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Тарифы, обзор, бенчмарки →

Llama 4 Maverick vs Muse Spark — сравнение бенчмарков

Бенчмарки

Вопросы и ответы

Llama 4 Maverick vs Muse Spark — сравнение бенчмарков

Бенчмарки

Вопросы и ответы