Все сравнения

Claude Sonnet 4.6 vs GPT-5.4 — сравнение бенчмарков

GPT-5.4

GPT-5.4 побеждает по соотношению цена/качество, Sonnet 4.6 — по скорости.

Бенчмарки

SWE-bench Verified
Claude
79.6
GPT-5.4
80
GPQA Diamond
Claude
74.1
GPT-5.4
92
Arena Elo
Claude
1438
GPT-5.4
1463
AIME 2025
Claude
95
GPT-5.4
88
Контекст (K)
Claude
1000
GPT-5.4
272
Средний балл: Claude 537.3vsGPT-5.4 399

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Главное отличие

GPT-5.4 сильнее в научных задачах (GPQA Diamond 92% vs 74.1%), а Claude Sonnet лучше в математике (AIME 2025: 95% vs 88%). По SWE-bench результаты практически одинаковые. Sonnet имеет контекст 1M vs 272K у GPT-5.4.

Когда выбрать Claude Sonnet 4.6

Sonnet выигрывает за счёт контекста 1M токенов — это в 3.7 раза больше, чем у GPT-5.4. Идеален для работы с большими кодовыми базами и длинными документами. Сильнее в математике и творческих задачах.

Когда выбрать GPT-5.4

GPT-5.4 лучше для научных задач и структурированного рассуждения. Доступен через ChatGPT Plus и API OpenAI. Превосходит Sonnet в ARC-AGI 2 и GPQA Diamond, что говорит о более сильном абстрактном мышлении.

Вопросы и ответы

Что дешевле?+
Sonnet: $3/$15. GPT-5.4: $2.50/$10. GPT чуть дешевле.
Что быстрее?+
Sonnet 4.6 значительно быстрее — до 2x.
Для чего Sonnet лучше?+
Повседневные задачи, быстрый кодинг, чат.
Для чего GPT лучше?+
Сложные рассуждения, мультимодальность с аудио.