Claude Opus 4.6 vs GPT-5.4 — сравнение бенчмарков

Claude Opus 4.6

Anthropic

Победитель

GPT-5.4

OpenAI

Claude Opus 4.6

Claude Opus 4.6 побеждает в задачах рассуждения и кодинга, GPT-5.4 сильнее в мультимодальности и скорости.

Бенчмарки

SWE-bench Verified

Claude

80.8

GPT-5.4

GPQA Diamond

Claude

91.3

GPT-5.4

AIME 2025

Claude

99.8

GPT-5.4

Arena Elo

Claude

1502

GPT-5.4

1463

Контекст (K)

Claude

1000

GPT-5.4

272

Средний балл: Claude 554.8vsGPT-5.4 399

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Opus 4.6

Anthropic

Самая мощная и интеллектуальная модель Anthropic из семейства Claude 4.6. Отлично справляется со сложными задачами: глубокий анализ, написание кода, работа с большими документами, мультимодальный ввод (текст и изображения). Поддерживает расширенное мышление, вызов инструментов и структурированные ответы. Идеальна для задач, требующих максимальной точности и рассуждений

Тарифы, обзор, бенчмарки →

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Что лучше для кода: Claude или GPT?+

Claude Opus 4.6 показывает 72.5% на SWE-bench vs 68.2% у GPT-5.4. Для сложного рефакторинга и агентного кодинга Claude предпочтительнее.

Какой контекст у Claude vs GPT?+

Claude Opus: 1M токенов. GPT-5.4: 1.05M токенов. Практически одинаковый.

Что дешевле?+

Claude Opus: $15/$75 per 1M. GPT-5.4: $2.50/$10. GPT значительно дешевле по API.

Какой быстрее?+

GPT-5.4 быстрее в стандартном режиме. Claude Opus медленнее, но точнее на сложных задачах.