Claude Opus 4.6 vs Claude Sonnet 4.6 — сравнение бенчмарков

Q: Extended thinking?

Оба поддерживают.

Claude Opus 4.6

Opus — для максимальной точности. Sonnet — для скорости и экономии. Оба от Anthropic.

Бенчмарки

SWE-bench Verified

Claude

80.8

Claude

79.6

GPQA Diamond

Claude

91.3

Claude

74.1

Arena Elo

Claude

1502

Claude

1438

MMLU

Claude

91.1

Claude

89.3

Цена input (dollM)

Claude

Средний балл: Claude 354vsClaude 336.8

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Opus 4.6

Anthropic

Самая мощная и интеллектуальная модель Anthropic из семейства Claude 4.6. Отлично справляется со сложными задачами: глубокий анализ, написание кода, работа с большими документами, мультимодальный ввод (текст и изображения). Поддерживает расширенное мышление, вызов инструментов и структурированные ответы. Идеальна для задач, требующих максимальной точности и рассуждений

Тарифы, обзор, бенчмарки →

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Когда Opus, когда Sonnet?+

Opus — юридика, наука, сложный рефакторинг. Sonnet — чат, быстрые задачи, массовые запросы.

Разница в цене?+

Opus в 5 раз дороже: $15 vs $3 per 1M input.

Extended thinking?+

Оба поддерживают.

Claude Code?+

Оба работают в Claude Code, Opus по умолчанию.