Claude Sonnet 4.6 vs GPT-5.4 — сравнение бенчмарков

Claude Sonnet 4.6

Anthropic

GPT-5.4

OpenAI

Победитель

GPT-5.4

GPT-5.4 побеждает по соотношению цена/качество, Sonnet 4.6 — по скорости.

Бенчмарки

SWE-bench Verified

Claude

79.6

GPT-5.4

GPQA Diamond

Claude

74.1

GPT-5.4

Arena Elo

Claude

1438

GPT-5.4

1463

AIME 2025

Claude

GPT-5.4

Контекст (K)

Claude

1000

GPT-5.4

272

Средний балл: Claude 537.3vsGPT-5.4 399

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

Тарифы, обзор, бенчмарки →

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Что дешевле?+

Sonnet: $3/$15. GPT-5.4: $2.50/$10. GPT чуть дешевле.

Что быстрее?+

Sonnet 4.6 значительно быстрее — до 2x.

Для чего Sonnet лучше?+

Повседневные задачи, быстрый кодинг, чат.

Для чего GPT лучше?+

Сложные рассуждения, мультимодальность с аудио.