Обзор

Модели DeepSeek: V4, R1, V3 и Coder - чем отличаются и что выбрать

21 апр 2026·5 мин чтения· 520

ШамильАвтор и главный редактор

Изучаю и тестирую нейросети более 2 лет. Основатель Shtruzel — помогаю разобраться в мире ИИ простым языком.

У

.

Комментарии (0)

Комментариев пока нет. Будьте первым!

).

deepseek-chat).

)

deepseek-reasoner).

).

deepseek-reasoner

)

).

:

.



R1		—
V4			1M
	—	—	—	—

</>code

1	Нужен быстрый текст / перевод / резюме → V3.2
2	Сложная математика / многошаговая логика → R1
3	Программирование через API или IDE → Coder V2
4	Максимальные возможности (когда выйдет) → V4

.

Присоединяйся к сообществу

Делись мыслями, обсуждай новости ИИ, подписывайся на авторов.

Перейти в ленту

Смотрите также

Stable Diffusion 3.5: что нового, отличия от SDXL и стоит ли переходить

Stable Diffusion 3.5 — последняя официальная версия SD. Разбираю без хайпа: что нового против SDXL, чем отличаются Large и Medium, сколько нужно видеопамяти и кому реально стоит переходить в 2026.

16 июн 2026·5 мин чтения· 90

FLUX — нейросеть для генерации картинок: версии, что умеет и как пользоваться бесплатно

FLUX — один из лучших генераторов картинок: фотореализм и связный текст на изображении. Разбираем, что это, чем версии Schnell, Dev, Pro и новая FLUX.2 отличаются, как пользоваться бесплатно из России и почему официального сайта-кнопки у FLUX нет.

16 июн 2026·5 мин чтения· 72

DeepSeek vs ChatGPT: что лучше, кто умнее и где бесплатно в 2026

Сравнили DeepSeek и ChatGPT по актуальным данным 2026: DeepSeek V4 против GPT-5.5. Где больше бесплатного, кто умнее, что работает в России без VPN и за что всё-таки придётся платить. Без воды и устаревших цифр.

11 июн 2026·5 мин чтения· 183

DeepSeek

не одна модель, а целое семейство — и они делают принципиально разные вещи. V3 это одно, R1 — другое, Coder — третье. Путаница здесь нормальная, потому что компания выпускает обновления быстро и не всегда с понятными пояснениями. Разберу каждую модель без технического жаргона, с реальными бенчмарками и честными оговорками там, где данные не подтверждены независимо.

Что такое

DeepSeek

в целом и почему он так популярен — в

отдельном обзоре

Как DeepSeek устроен — одна минута теории

Все крупные модели DeepSeek работают на архитектуре

Mixture of Experts (MoE)

. Объясню на пальцах.

Представьте большую компанию с тысячей сотрудников-специалистов: программисты, юристы, историки, математики. Когда вы задаёте вопрос, не все тысяча начинают думать — только те, чья специализация релевантна. Остальные «спят».

Именно так работает MoE: у DeepSeek V4, например,

~1 триллион параметров

всего, но при обработке каждого запроса активируется только около

32–37 миллиардов

. Это и есть причина, почему модели такие дешёвые в эксплуатации — платите только за «проснувшихся специалистов».

Что такое бенчмарки — и почему им не стоит слепо доверять

Прежде чем смотреть на цифры, важно понять, что они значат.

SWE-bench Verified

— дают модели реальные баги из настоящих GitHub-репозиториев и смотрят, напишет ли она работающий патч. Это самый близкий к реальности тест для программирования. Процент — доля успешно решённых задач.

HumanEval

— стандартные задачи по программированию. Менее жёсткий, чем SWE-bench, зато давно устоявшийся. Хорош для сравнения поколений моделей.

MATH / AIME

— математические задачи олимпийского уровня. Тестирует многошаговые рассуждения, а не просто знание формул.

MMLU

— 57 тем: история, право, биология, физика, медицина. Проверяет общую «образованность» модели.

⚠️

Важная оговорка.

Бенчмарки от самой компании — это маркетинг, пока их не проверили независимые исследователи. Ниже я явно указываю, какие данные подтверждены третьей стороной, а какие нет.

DeepSeek V3 и V3.2 — текущая рабочая лошадка

Статус:

стабильная, в открытом доступе, используется в API прямо сейчас.

DeepSeek V3 вышел в декабре 2024 года и стал первым по-настоящему громким релизом компании.

671 миллиард параметров

, обучен примерно за $5.6 млн — в 10–20 раз дешевле сопоставимых западных моделей (источник: технический отчёт DeepSeek-V3, опубликован на

arxiv.org

V3.2 — это тот же фундамент, но с улучшенным постобучением. Именно V3.2 (под названием

) сейчас работает через официальный API DeepSeek по состоянию на апрель 2026 (источник:

codersera.com

, апрель 2026

Бенчмарки V3.2-Speciale (подтверждены независимо)

Тест

Результат

Что это значит

SWE-bench Verified

67.8%

Решает ~68 из 100 реальных GitHub-багов

HumanEval

~85%

Стандартные задачи по программированию

Цена API:

$0.28 / 1M входных токенов, $0.42 / 1M выходных

(Источник:

nxcode.io

, март 2026

Для чего:

Повседневные задачи — написать текст, разобрать документ, помочь с кодом. Лучшее соотношение цена/результат в своём классе.

DeepSeek R1 — модель для задач «подумай как следует»

Статус:

стабильная, доступна через API (

R1 вышел в январе 2025 года — это reasoning-модель, построенная на базе V3. Принципиальное отличие: она обучена

показывать ход рассуждений

. Перед финальным ответом видно, как модель проверяет гипотезы, отбрасывает ошибочные пути, приходит к выводу.

Технически: R1 обучали через усиленное обучение без начального supervised fine-tuning. Это значит, что она выработала собственные стратегии рассуждений методом проб и ошибок (источник:

bentoml.com

Когда использовать R1 вместо V3

Включайте

когда:

Решаете математическую задачу с несколькими шагами

Нужно проверить логику рассуждения, а не просто получить ответ

Анализируете сложный код с неочевидной ошибкой

Задача требует «подождать и подумать», а не быстрого ответа

Не нужен когда:

Пишете текст, переводите, делаете резюме

Задаёте простой вопрос

Работаете с изображениями

Цена API:

$0.55 / 1M входных токенов, $2.19 / 1M выходных — дороже V3, потому что генерирует больше внутренних «думающих» токенов

(Источник:

nxcode.io

Для сравнения: OpenAI o1 стоит $15 / $60 за миллион токенов. R1 при сопоставимых задачах обходится примерно в 27 раз дешевле.

DeepSeek V4 — новый флагман (и честно о статусе)

Статус:

⚠️ Ситуация неоднозначная — читайте внимательно.

V4 анонсирован несколько раз, дата сдвигалась. По данным Reuters от 3 апреля 2026, релиз ожидается «в течение нескольких недель» на чипах Huawei Ascend 950PR (источник:

Reuters, 3 апреля 2026

). По данным на 11 апреля 2026, официальный

API DeepSeek всё ещё работает на V3.2

— V4 там не появился (источник:

ghost.codersera.com

, апрель 2026

Что про V4

подтверждено

~1 триллион параметров, ~32 млрд активных на токен

Архитектура

Engram

— новый механизм памяти для длинных контекстов

Контекстное окно: 1M токенов

Работает на чипах Huawei — первая фронтирная модель без Nvidia

Что

заявлено, но не подтверждено независимо

SWE-bench Verified: ~81% (только внутренние тесты DeepSeek)

HumanEval: ~90%

Подробный разбор архитектуры V4 — в статье

DeepSeek V4: триллион параметров

. Страница модели:

DeepSeek V4

DeepSeek Coder — для программистов

Статус:

стабильная специализированная модель.

DeepSeek Coder V2

— отдельная ветка, заточенная под разработку. Обучена на огромном корпусе кода: автодополнение, написание функций, объяснение чужого кода, рефакторинг, поиск ошибок.

Используйте Coder если работаете в IDE через плагин или строите кодинговый агент через API — она оптимизирована именно под эти сценарии, в отличие от V3/V4, которые универсальные.

Сводная таблица

Модель

Параметры активных

SWE-bench

Контекст (API)

Цена вход

Открытый код

V3.2

37B

67.8%¹

128K

$0.28/1M

✅ MIT

37B

128K

$0.55/1M

✅ MIT

~32B

¹ Подтверждено независимо ² Только внутренние тесты DeepSeek, не подтверждено

Источники:

nxcode.io

, официальная документация DeepSeek

Как выбрать модель под задачу

Сравнение DeepSeek V4 с Gemini 3.1 Pro —

здесь

. Сравнение всех топовых нейросетей —

DeepSeek vs ChatGPT vs Gemini

. Рейтинг нейросетей для сложных задач —

reasoning-модели

Хаб DeepSeek:

новости, обновления, обсуждения —

https://shtruzel.ru/deepseek

~81%²

~$0.30/1M

✅ ожидается

Coder V2

✅ MIT