Llama 4 Nemotron vs Qwen 3 — сравнение бенчмарков

Ничья

Llama 4 Nemotron и Qwen 3 показывают сопоставимые результаты. Nemotron сильнее в математике, Qwen 3 — в коде и азиатских языках.

Бенчмарки

MMLU

Llama

91.7

Qwen

89.4

HumanEval (код)

Llama

87.1

Qwen

85.7

GSM8K (математика)

Llama

94.6

Qwen

93.8

Arena Elo

Llama

1312

Qwen

1298

Средний балл: Llama 396.4vsQwen 391.7

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Llama 4 Nemotron

NVIDIA + Meta

Доработанная NVIDIA версия Llama 4 Maverick от Meta — 17B активных параметров из 400B MoE. Лидер открытых моделей по качеству рассуждений, превосходит GPT-4o и Claude Sonnet на ключевых бенчмарках.

Тарифы, обзор, бенчмарки →

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

Тарифы, обзор, бенчмарки →

Llama 4 Nemotron vs Qwen 3 — сравнение бенчмарков

Бенчмарки

Вопросы и ответы

Llama 4 Nemotron vs Qwen 3 — сравнение бенчмарков

Бенчмарки

Вопросы и ответы