DeepSeek V4 vs Grok 3 — сравнение бенчмарков

DeepSeek V4

DeepSeek V4 лидирует по большинству академических бенчмарков и стоимости использования. Grok 3 выигрывает благодаря уникальному доступу к актуальным данным X и интеграции с платформой Илона Маска.

Бенчмарки

MMLU

DeepSeek

Grok

HumanEval

DeepSeek

Grok

MATH

DeepSeek

Grok

Arena Elo

DeepSeek

1310

Grok

1295

Средний балл: DeepSeek 389.8vsGrok 384

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

DeepSeek V4

DeepSeek

Ожидаемая флагманская open-source модель от DeepSeek. 1 трлн параметров (MoE, ~37 млрд активных), контекст 1 млн токенов, архитектура Engram для условной памяти. Первая фронтирная модель на чипах Huawei Ascend без NVIDIA. Предварительные бенчмарки: SWE-bench 80%+, HumanEval 90%. Ожидаемая цена — в 20–50 раз дешевле западных аналогов. Полный релиз ожидается в апреле 2026.

Тарифы, обзор, бенчмарки →

Grok 3

xAI

Флагманская модель от xAI (Илон Маск). Контекст 131K токенов, режим рассуждений, интеграция с X (Twitter) для доступа к данным в реальном времени. Минимальная цензура среди фронтирных моделей.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Есть ли у DeepSeek V4 доступ к интернету?+

В базовой версии нет, однако через API можно подключить поисковые инструменты. Grok 3 нативно интегрирован с X и имеет доступ к актуальным данным в реальном времени.

Где дешевле: DeepSeek или Grok?+

DeepSeek V4 значительно дешевле: $0.27 за 1М токенов. Grok 3 доступен через X Premium+ ($16/мес) или отдельную подписку SuperGrok — это менее гибкая модель ценообразования.

Какая модель лучше для работы с новостями?+

Grok 3 однозначно лучше: доступ к X в реальном времени позволяет анализировать текущие тренды, последние новости и реакцию сообщества. DeepSeek V4 ограничен данными на дату обучения.

Какая модель лучше для кода?+

DeepSeek V4 обучался на огромном объёме кода и показывает HumanEval 82% против 78% у Grok 3. Для сложных задач программирования DeepSeek предпочтительнее.