не одна модель, а целое семейство — и они делают принципиально разные вещи. V3 это одно, R1 — другое, Coder — третье. Путаница здесь нормальная, потому что компания выпускает обновления быстро и не всегда с понятными пояснениями. Разберу каждую модель без технического жаргона, с реальными бенчмарками и честными оговорками там, где данные не подтверждены независимо.
Что такое
DeepSeek
в целом и почему он так популярен — в
отдельном обзоре
Как DeepSeek устроен — одна минута теории
Все крупные модели DeepSeek работают на архитектуре
Mixture of Experts (MoE)
. Объясню на пальцах.
Представьте большую компанию с тысячей сотрудников-специалистов: программисты, юристы, историки, математики. Когда вы задаёте вопрос, не все тысяча начинают думать — только те, чья специализация релевантна. Остальные «спят».
Именно так работает MoE: у DeepSeek V4, например,
~1 триллион параметров
всего, но при обработке каждого запроса активируется только около
32–37 миллиардов
. Это и есть причина, почему модели такие дешёвые в эксплуатации — платите только за «проснувшихся специалистов».
Что такое бенчмарки — и почему им не стоит слепо доверять
Прежде чем смотреть на цифры, важно понять, что они значат.
SWE-bench Verified
— дают модели реальные баги из настоящих GitHub-репозиториев и смотрят, напишет ли она работающий патч. Это самый близкий к реальности тест для программирования. Процент — доля успешно решённых задач.
HumanEval
— стандартные задачи по программированию. Менее жёсткий, чем SWE-bench, зато давно устоявшийся. Хорош для сравнения поколений моделей.
MATH / AIME
— математические задачи олимпийского уровня. Тестирует многошаговые рассуждения, а не просто знание формул.
Бенчмарки от самой компании — это маркетинг, пока их не проверили независимые исследователи. Ниже я явно указываю, какие данные подтверждены третьей стороной, а какие нет.
DeepSeek V3 и V3.2 — текущая рабочая лошадка
Статус:
стабильная, в открытом доступе, используется в API прямо сейчас.
DeepSeek V3 вышел в декабре 2024 года и стал первым по-настоящему громким релизом компании.
671 миллиард параметров
, обучен примерно за $5.6 млн — в 10–20 раз дешевле сопоставимых западных моделей (источник: технический отчёт DeepSeek-V3, опубликован на
arxiv.org
V3.2 — это тот же фундамент, но с улучшенным постобучением. Именно V3.2 (под названием
) сейчас работает через официальный APIDeepSeek по состоянию на апрель 2026 (источник:
codersera.com
, апрель 2026
Бенчмарки V3.2-Speciale (подтверждены независимо)
Тест
Результат
Что это значит
SWE-bench Verified
67.8%
Решает ~68 из 100 реальных GitHub-багов
HumanEval
~85%
Стандартные задачи по программированию
Цена API:
$0.28 / 1M входных токенов, $0.42 / 1M выходных
(Источник:
nxcode.io
, март 2026
Для чего:
Повседневные задачи — написать текст, разобрать документ, помочь с кодом. Лучшее соотношение цена/результат в своём классе.
DeepSeek R1 — модель для задач «подумай как следует»
Статус:
стабильная, доступна через API (
R1 вышел в январе 2025 года — это reasoning-модель, построенная на базе V3. Принципиальное отличие: она обучена
показывать ход рассуждений
. Перед финальным ответом видно, как модель проверяет гипотезы, отбрасывает ошибочные пути, приходит к выводу.
Технически: R1 обучали через усиленное обучение без начального supervised fine-tuning. Это значит, что она выработала собственные стратегии рассуждений методом проб и ошибок (источник:
bentoml.com
Когда использовать R1 вместо V3
Включайте
когда:
Решаете математическую задачу с несколькими шагами
Нужно проверить логику рассуждения, а не просто получить ответ
Анализируете сложный код с неочевидной ошибкой
Задача требует «подождать и подумать», а не быстрого ответа
Не нужен когда:
Пишете текст, переводите, делаете резюме
Задаёте простой вопрос
Работаете с изображениями
Цена API:
$0.55 / 1M входных токенов, $2.19 / 1M выходных — дороже V3, потому что генерирует больше внутренних «думающих» токенов
(Источник:
nxcode.io
Для сравнения: OpenAI o1 стоит $15 / $60 за миллион токенов. R1 при сопоставимых задачах обходится примерно в 27 раз дешевле.
DeepSeek V4 — новый флагман (и честно о статусе)
Статус:
⚠️ Ситуация неоднозначная — читайте внимательно.
V4 анонсирован несколько раз, дата сдвигалась. По данным Reuters от 3 апреля 2026, релиз ожидается «в течение нескольких недель» на чипах Huawei Ascend 950PR (источник:
Reuters, 3 апреля 2026
). По данным на 11 апреля 2026, официальный
APIDeepSeek всё ещё работает на V3.2
— V4 там не появился (источник:
ghost.codersera.com
, апрель 2026
Что про V4
подтверждено
~1 триллион параметров, ~32 млрд активных на токен
Архитектура
Engram
— новый механизм памяти для длинных контекстов
Контекстное окно: 1M токенов
Работает на чипах Huawei — первая фронтирная модель без Nvidia
Что
заявлено, но не подтверждено независимо
SWE-bench Verified: ~81% (только внутренние тесты DeepSeek)
HumanEval: ~90%
Подробный разбор архитектуры V4 — в статье
DeepSeek V4: триллион параметров
. Страница модели:
DeepSeek V4
DeepSeek Coder — для программистов
Статус:
стабильная специализированная модель.
DeepSeek Coder V2
— отдельная ветка, заточенная под разработку. Обучена на огромном корпусе кода: автодополнение, написание функций, объяснение чужого кода, рефакторинг, поиск ошибок.
Используйте Coder если работаете в IDE через плагин или строите кодинговый агент через API — она оптимизирована именно под эти сценарии, в отличие от V3/V4, которые универсальные.
Сводная таблица
Модель
Параметры активных
SWE-bench
Контекст (API)
Цена вход
Открытый код
V3.2
37B
67.8%¹
128K
$0.28/1M
✅ MIT
37B
128K
$0.55/1M
✅ MIT
~32B
¹ Подтверждено независимо
² Только внутренние тесты DeepSeek, не подтверждено