Claude Opus 4.6 vs Grok 3 — сравнение бенчмарков

Claude Opus 4.6

Anthropic

Победитель

Grok 3

xAI

Claude Opus 4.6

Claude Opus значительно мощнее в коде и рассуждениях. Grok 3 — быстрее и бесплатный через X.

Бенчмарки

GPQA Diamond

Claude

91.3

Grok

84.6

Arena Elo

Claude

1502

Grok

1402

SWE-bench Verified

Claude

80.8

Grok

49.3

MMLU-Pro

Claude

77.3

Grok

79.9

AIME 2025

Claude

99.8

Grok

93.3

Средний балл: Claude 370.2vsGrok 341.8

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Opus 4.6

Anthropic

Самая мощная и интеллектуальная модель Anthropic из семейства Claude 4.6. Отлично справляется со сложными задачами: глубокий анализ, написание кода, работа с большими документами, мультимодальный ввод (текст и изображения). Поддерживает расширенное мышление, вызов инструментов и структурированные ответы. Идеальна для задач, требующих максимальной точности и рассуждений

Тарифы, обзор, бенчмарки →

Grok 3

xAI

Флагманская модель от xAI (Илон Маск). Контекст 131K токенов, режим рассуждений, интеграция с X (Twitter) для доступа к данным в реальном времени. Минимальная цензура среди фронтирных моделей.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Grok бесплатный?+

Базовый Grok бесплатен через X (Twitter). Claude — от $20/мес.

Для кода?+

Claude Opus кратно лучше: SWE-bench 72% vs 48%.

Скорость?+

Grok 3 быстрее в стандартном режиме.

Мультимодальность?+

Оба поддерживают изображения.