Для каких задач Grok 3?

Grok 3 лидирует в сложных задачах вроде математики (AIME 93.3%) и GPQA (84.6%). Подходит для глубокого анализа и минимальной цензуры.

Все сравнения

Claude Haiku 4.5 vs Grok 3 — сравнение бенчмарков

Claude Haiku 4.5

Claude Haiku 4.5 выигрывает за счет значительно более низкой цены API ($1/$5 против $3/$15 за 1M токенов) и высокой скорости, подходящей для большинства текстовых задач. Grok 3 сильнее в сложном мышлении, но дороже.

Бенчмарки

GPQA

Claude

Grok

84.6

AIME 2025

Claude

80.7

Grok

93.3

Средний балл: Claude 76.9vsGrok 88.9

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Haiku 4.5

Anthropic

Быстрая и экономичная модель Anthropic. 200K контекст, до 64K выход. Extended thinking, computer use, context awareness. Производительность уровня Claude Sonnet 4 в 3 раза дешевле. Скорость в 4-5 раз выше Sonnet 4.5.

Тарифы, обзор, бенчмарки →

Grok 3

xAI

Флагманская модель от xAI (Илон Маск). Контекст 131K токенов, режим рассуждений, интеграция с X (Twitter) для доступа к данным в реальном времени. Минимальная цензура среди фронтирных моделей.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Что лучше для кодинга?+

Claude Haiku 4.5 показывает производительность уровня Claude Sonnet 4 по кодингу при цене в 3 раза ниже и скорости в 4-5 раз выше. Grok 3 тоже силен, но дороже. Подходит Haiku для pair programming и агентов.

Какая модель дешевле?+

Claude Haiku 4.5 дешевле в API: $1/1M input и $5/1M output против $3/$15 у Grok 3. Для подписки Claude Pro $20/мес, X Premium+ $22/мес. Haiku выгоднее для высоких объемов.

Какой размер контекста?+

Claude Haiku 4.5 имеет 200K токенов, Grok 3 — 1M токенов по одним источникам или 131K по другим. Grok лучше для очень длинных контекстов.

Поддерживает ли мультимодальность?+

Grok 3 мультимодальный с видеообработкой, Claude Haiku 4.5 — текстовая модель. Для изображений/видео выбирайте Grok.

Какая быстрее?+

Claude Haiku 4.5 в 4-5 раз быстрее Sonnet 4.5, идеальна для реального времени. Grok 3 медленнее из-за режима мышления.