DeepSeek V4 vs Qwen 3 — сравнение бенчмарков

DeepSeek V4

DeepSeek

Победитель

Qwen 3

Alibaba Cloud

DeepSeek V4

DeepSeek V4 мощнее на сложных задачах, Qwen 3 — больше вариантов размеров и Apache 2.0.

Бенчмарки

Arena Elo

DeepSeek

1421

Qwen

1400

MMLU-Pro

DeepSeek

Qwen

GPQA Diamond

DeepSeek

79.9

Qwen

88.4

SWE-bench Verified

DeepSeek

67.8

Qwen

Размеры моделей

DeepSeek

Qwen

Средний балл: DeepSeek 330.9vsQwen 331.3

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

DeepSeek V4

DeepSeek

Ожидаемая флагманская open-source модель от DeepSeek. 1 трлн параметров (MoE, ~37 млрд активных), контекст 1 млн токенов, архитектура Engram для условной памяти. Первая фронтирная модель на чипах Huawei Ascend без NVIDIA. Предварительные бенчмарки: SWE-bench 80%+, HumanEval 90%. Ожидаемая цена — в 20–50 раз дешевле западных аналогов. Полный релиз ожидается в апреле 2026.

Тарифы, обзор, бенчмарки →

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Open source?+

Оба. DeepSeek — MIT. Qwen 3 — Apache 2.0.

Русский?+

Оба поддерживают. Qwen: 119 языков.

Для локального?+

Qwen 3: от 0.6B до 235B. DeepSeek V4: только полная модель.

Цены API?+

DeepSeek: $0.27/1M. Qwen: от $0.05/1M (8B).