Все сравнения

Llama 4 Maverick vs Qwen 3 — сравнение бенчмарков
Ничья
Llama 4 Maverick и Qwen 3 — конкурентоспособные open-weight LLM от Meta и Alibaba. Qwen 3 выигрывает в азиатских языках и математике, Llama 4 Maverick — в мультимодальности.
Бенчмарки
MMLU
Llama
88.2
Qwen
89.4
HumanEval (код)
Llama
82.4
Qwen
85.7
GSM8K (математика)
Llama
91.3
Qwen
93.8
Arena Elo
Llama
1287
Qwen
1298
Средний балл: Llama 387.2vsQwen 391.7
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Llama 4 Maverick
Meta
Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.
Тарифы, обзор, бенчмарки →Qwen 3
Alibaba Cloud
Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.
Тарифы, обзор, бенчмарки →