упали на 17% за один день — компания потеряла около $600 млрд капитализации. Рекорд для любой компании в истории. Причиной стал выход
DeepSeek-R1
— модели китайского стартапа, которую обучили за $6 млн, когда сопоставимые американские модели требовали $100+ млн (источник:
Britannica, апрель 2026
С тех пор
DeepSeek
стал одним из самых обсуждаемых инструментов в мире ИИ. Разберу, что это такое, как устроено и зачем вам об этом знать.
Кто стоит за DeepSeek
DeepSeek
(полное название: Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.) — китайская AI-компания, основанная в июле 2023 года
Лян Вэньфэном
(Liang Wenfeng) в Ханчжоу, провинция Чжэцзян.
Это не типичный стартап. DeepSeek принадлежит и финансируется хедж-фондом
High-Flyer
— одним из крупнейших квантовых фондов Китая, который тот же Лян Вэньфэн основал ранее. Именно из этой среды — алгоритмической торговли, где каждый вычислительный цикл стоит денег — выросла философия DeepSeek: максимальная эффективность на минимальных ресурсах.
Источник:
Wikipedia, DeepSeek
Почему DeepSeek взорвал индустрию
До января 2025 года в AI-мире было негласное правило: хочешь топовую модель — плати за огромные вычислительные мощности. Meta потратила на Llama 3.1 колоссальные ресурсы. OpenAI — ещё больше.
DeepSeek сломал это правило дважды:
1. Эффективность обучения.
V3 обучили примерно за $6 млн — против $100+ млн у GPT-4 в 2023-м. R1 использует в 10 раз меньше вычислительной мощности, чем сопоставимый Llama 3.1 от Meta, и работает примерно на 95% дешевле ChatGPT-o1 (источник:
Britannica
2. Открытый код.
DeepSeek публикует веса моделей под MIT-лицензией и выпускает подробные методологические отчёты — в отличие от «чёрного ящика» американских конкурентов. Любой разработчик может скачать модель и запустить у себя.
Результат: к 27 января 2025 года DeepSeek обогнал ChatGPT в американском App Store по количеству скачиваний. Это и обвалило Nvidia.
Как устроен DeepSeek технически
Ключевая архитектурная инновация —
Mixture of Experts (MoE)
. В модели V3 671 млрд параметров, но при обработке каждого запроса активируются лишь около 37 млрд. Это как иметь большую команду специалистов, но в каждый момент работают только те, кто нужен для конкретной задачи — остальные «спят».
Это и объясняет низкую стоимость: вы платите только за активные параметры, а не за все.
Дополнительные инновации в последних версиях:
Multi-head Latent Attention
— сжатие KV-кэша для более эффективной обработки длинных контекстов
Engram
— архитектура памяти в V4, разделяющая хранение фактов и динамическое рассуждение
Линейка моделей на апрель 2026
Модель
Тип
Для чего
DeepSeek V4
Универсальный чат
Основная модель для повседневных задач
DeepSeek V3.2
Универсальный
Стабильная GA-версия, доступна везде
DeepSeek R1
Рассуждения
Математика, логика, сложные цепочки
DeepSeek Coder V2
Код
Программирование, отладка, рефакторинг
DeepSeek V4
— актуальный флагман на март 2026. На SWE-bench Verified набирает
81%
— наравне с топовыми коммерческими моделями при цене API $0.28/1M входных токенов (источник:
morphllm.com
, март 2026
). Подробный разбор архитектуры и параметров — в статье
DeepSeek V4: триллион параметров
DeepSeek R1
— reasoning-модель, специально заточенная под математику и пошаговые рассуждения. По стоимости в ~95 раз дешевле сопоставимых продуктов OpenAI.
Что DeepSeek умеет делать
Из реальных сильных сторон, подтверждённых независимыми тестами:
Код.
Это историческая специализация DeepSeek. Первая модель компании в ноябре 2023 года называлась DeepSeek Coder — не просто чат-бот. V4 на SWE-bench обходит Gemini 3.1 Pro (80.6%) и GPT-5.4 (~74.9%).
Математика и логика.
R1 изначально создавался для рассуждений: формальные доказательства, математические задачи, структурированная логика. На математических бенчмарках конкурирует с моделями в 10× дороже.
Анализ длинных документов.
Контекстное окно до 1M токенов в топовых версиях.
Чего нет нативно:
генерации изображений (только через Janus Pro), голосового режима, интеграции с внешними сервисами типа Google Workspace.
DeepSeek vs ChatGPT vs Gemini: коротко
DeepSeek V4
GPT-5.4
Gemini 3.1 Pro
Код (SWE-bench)
81%
~75%
80.6%
Цена API (вход)
$0.28/1M
$2.50/1M
$2.00/1M
Мультимодальность
Текст + код
Текст + фото
Текст + фото + аудио + видео
Открытый код
Полное сравнение —
DeepSeek vs ChatGPT vs Gemini
. Детальные сравнения:
DeepSeek V4 vs Gemini 3.1 Pro
·
GPT-5.4 vs DeepSeek V4
. Страница модели —
DeepSeek V4
Доступен ли DeepSeek в России
Да — и это главное практическое преимущество для российских пользователей. DeepSeek — китайская компания, санкции на неё не распространяются. Сайт
chat.deepseek.com
открывается без VPN, приложение доступно в российском App Store и Google Play.
Единственная регулярная проблема — перегрузка серверов. Сообщение «сервер занят» или «слишком частые сообщения» — нормальная ситуация в пиковые часы. Подробно о том, что делать в таких случаях — в
отдельной статье
Список нейросетей, которые работают в России без VPN — в
рейтинге
Вопрос о данных
Это честный вопрос, который стоит задать. DeepSeek — китайская компания, работающая по законодательству КНР. Политика конфиденциальности предполагает, что данные хранятся на серверах в Китае и могут быть переданы властям по запросу.
Для бытовых задач (написать текст, отладить код, задать вопрос) это не проблема. Для корпоративных задач с конфиденциальными данными — нужно учитывать. Отдельный разбор этой темы — в статье
DeepSeek и безопасность данных
Итог
DeepSeek — реальный конкурент американским AI-платформам, а не маркетинговый продукт. Компания доказала, что топовый результат достижим без сотен миллионов долларов на обучение. Для разработчиков, аналитиков и всех, кому нужен бесплатный доступ из России — это один из самых практичных инструментов на сегодня.
Хаб DeepSeek на Shtruzel: новости, обсуждения, обновления —