DeepSeek V4 vs Gemini 3.1 Pro — сравнение бенчмарков

DeepSeek V4

DeepSeek

Gemini 3.1 Pro

Google

Ничья

DeepSeek — дешевле в 10 раз. Gemini — рекордный контекст 2M и мультимодальность.

Бенчмарки

SWE-bench Verified

DeepSeek

67.8

Gemini

80.6

GPQA Diamond

DeepSeek

79.9

Gemini

94.3

Arena Elo

DeepSeek

1421

Gemini

1492

MMLU-Pro

DeepSeek

DeepSeek V4

DeepSeek

Ожидаемая флагманская open-source модель от DeepSeek. 1 трлн параметров (MoE, ~37 млрд активных), контекст 1 млн токенов, архитектура Engram для условной памяти. Первая фронтирная модель на чипах Huawei Ascend без NVIDIA. Предварительные бенчмарки: SWE-bench 80%+, HumanEval 90%. Ожидаемая цена — в 20–50 раз дешевле западных аналогов. Полный релиз ожидается в апреле 2026.

Тарифы, обзор, бенчмарки →

Gemini 3.1 Pro

Google

Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Что дешевле?+

DeepSeek — в 13 раз дешевле по input.

Видео?+

Gemini анализирует видео нативно. DeepSeek — нет.

Контекст?+

Gemini: 2M (рекорд). DeepSeek: ~1M.

Качество?+

MMLU Pro одинаковый: 82%.