Llama 4 Maverick vs Qwen 3 — сравнение бенчмарков

Llama 4 Maverick

Бенчмарки

MMLU

Llama

88.2

Qwen

89.4

HumanEval (код)

Llama

82.4

Qwen

85.7

GSM8K (математика)

Llama

91.3

Qwen

93.8

Arena Elo

Llama

1287

Qwen

1298

Средний балл: Llama 387.2vsQwen 391.7

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Llama 4 Maverick

Meta

Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.

Тарифы, обзор, бенчмарки →

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

Тарифы, обзор, бенчмарки →

Llama 4 Maverick vs Qwen 3 — сравнение бенчмарков

Бенчмарки

Вопросы и ответы

Llama 4 Maverick vs Qwen 3 — сравнение бенчмарков

Бенчмарки

Вопросы и ответы