Claude Sonnet 4.6 vs Gemini 3.1 Pro — сравнение бенчмарков

Claude Sonnet 4.6

Anthropic

Gemini 3.1 Pro

Google

Ничья

Sonnet быстрее и дешевле для кода, Gemini — рекордный контекст 2M и видео.

Бенчмарки

SWE-bench Verified

Claude

79.6

Gemini

80.6

GPQA Diamond

Claude

74.1

Gemini

94.3

MMLU

Claude

89.3

Gemini

92.6

Arena Elo

Claude

1438

Gemini

1492

Контекст (K)

Claude

1000

Gemini

1000

Средний балл: Claude 536.2vsGemini 551.9

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

Тарифы, обзор, бенчмарки →

Gemini 3.1 Pro

Google

Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Контекст?+

Gemini: 2M. Sonnet: 200K.

Цены?+

Sonnet: $3/$15. Gemini Pro: $3.50/$10.50.

Для чего Sonnet?+

Быстрый кодинг, повседневные задачи.

Для чего Gemini?+

Анализ длинных документов и видео.