Claude Haiku 4.5 vs DeepSeek V4 — сравнение бенчмарков

Ничья

DeepSeek V4 и Claude Haiku 4.5 сопоставимы по возможностям, при этом DeepSeek выигрывает по цене и математике, а Haiku — по безопасности и следованию инструкциям.

Бенчмарки

MMLU

Claude

DeepSeek

HumanEval

Claude

DeepSeek

MATH

Claude

DeepSeek

Arena Elo

Claude

1210

DeepSeek

1215

Средний балл: Claude 358.5vsDeepSeek 365

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Haiku 4.5

Anthropic

Быстрая и экономичная модель Anthropic. 200K контекст, до 64K выход. Extended thinking, computer use, context awareness. Производительность уровня Claude Sonnet 4 в 3 раза дешевле. Скорость в 4-5 раз выше Sonnet 4.5.

Тарифы, обзор, бенчмарки →

DeepSeek V4

DeepSeek

Ожидаемая флагманская open-source модель от DeepSeek. 1 трлн параметров (MoE, ~37 млрд активных), контекст 1 млн токенов, архитектура Engram для условной памяти. Первая фронтирная модель на чипах Huawei Ascend без NVIDIA. Предварительные бенчмарки: SWE-bench 80%+, HumanEval 90%. Ожидаемая цена — в 20–50 раз дешевле западных аналогов. Полный релиз ожидается в апреле 2026.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

DeepSeek V4 дешевле Claude Haiku 4.5?+

Да, DeepSeek V4 существенно дешевле: входящие токены практически бесплатны благодаря кешированию, тогда как Haiku 4.5 стоит $0.8 за 1М входящих токенов.

Какая модель лучше для математики?+

DeepSeek V4 превосходит Haiku в математических задачах: MATH benchmark 82 vs 68.

Есть ли риски использования DeepSeek?+

DeepSeek — китайская компания, что может создавать ограничения в корпоративных политиках безопасности ряда стран.

Обе модели работают с русским текстом?+

Да, обе модели поддерживают русский язык, хотя Haiku 4.5 более предсказуем в следовании инструкциям.