DeepSeek V4 vs Grok 3 — сравнение бенчмарков
DeepSeek V4 лидирует по большинству академических бенчмарков и стоимости использования. Grok 3 выигрывает благодаря уникальному доступу к актуальным данным X и интеграции с платформой Илона Маска.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Ожидаемая флагманская open-source модель от DeepSeek. 1 трлн параметров (MoE, ~37 млрд активных), контекст 1 млн токенов, архитектура Engram для условной памяти. Первая фронтирная модель на чипах Huawei Ascend без NVIDIA. Предварительные бенчмарки: SWE-bench 80%+, HumanEval 90%. Ожидаемая цена — в 20–50 раз дешевле западных аналогов. Полный релиз ожидается в апреле 2026.
Тарифы, обзор, бенчмарки →Флагманская модель от xAI (Илон Маск). Контекст 131K токенов, режим рассуждений, интеграция с X (Twitter) для доступа к данным в реальном времени. Минимальная цензура среди фронтирных моделей.
Тарифы, обзор, бенчмарки →