Llama 4 Scout vs Qwen 3 — сравнение бенчмарков
Qwen 3 превосходит по математике и рассуждениям; Llama 4 Scout лидирует в длинном контексте.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Llama 4 Scout от Meta и Qwen 3 от Alibaba — два ведущих открытых конкурента 2025 года. Qwen 3 72B лидирует на лидербордах благодаря сильным математическим способностям.
Scout выигрывает в контекстном окне: до 10 миллионов токенов против 32K у Qwen 3. Qwen 3 превосходит на MATH (83.9% против 71.3%) и HumanEval (88.5% против 78.4%).
Для математики, кода и агентных задач — Qwen 3. Для обработки длинных документов — Llama 4 Scout.
MoE-модель Meta с 16 экспертами. 109B параметров, 17B активных. Рекордный контекст 10 миллионов токенов. Текст, изображения, видео. 40 трлн токенов обучения, 200 языков. Llama 4 Community License.
Тарифы, обзор, бенчмарки →Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.
Тарифы, обзор, бенчмарки →