Все сравнения

Claude Sonnet 4.6 vs Gemini 3.1 Pro — сравнение бенчмарков

Ничья

Sonnet быстрее и дешевле для кода, Gemini — рекордный контекст 2M и видео.

Бенчмарки

SWE-bench Verified
Claude
79.6
Gemini
80.6
GPQA Diamond
Claude
74.1
Gemini
94.3
MMLU
Claude
89.3
Gemini
92.6
Arena Elo
Claude
1438
Gemini
1492
Контекст (K)
Claude
1000
Gemini
1000
Средний балл: Claude 536.2vsGemini 551.9

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Главное отличие

Gemini 3.1 Pro заметно превосходит Claude Sonnet 4.6 в научных бенчмарках: GPQA Diamond (94.3% vs 74.1%), MMLU (92.6% vs 89.3%), Arena Elo (1492 vs 1438). По SWE-bench результаты близки (80.6% vs 79.6%). Оба имеют контекст 1M токенов.

Когда выбрать Claude Sonnet 4.6

Sonnet сильнее в написании кода и текстов с нюансами. Превосходный выбор для разработки, код-ревью и творческих задач. Встроенная поддержка артефактов и системных промптов делает его удобным для сложных рабочих процессов.

Когда выбрать Gemini 3.1 Pro

Gemini 3.1 Pro — лучший выбор для научных задач, мультимодальных проектов и работы в экосистеме Google. GPQA Diamond 94.3% — лучший результат среди всех моделей. Стоимость ниже, чем у Sonnet.

Вопросы и ответы

Контекст?+
Gemini: 2M. Sonnet: 200K.
Цены?+
Sonnet: $3/$15. Gemini Pro: $3.50/$10.50.
Для чего Sonnet?+
Быстрый кодинг, повседневные задачи.
Для чего Gemini?+
Анализ длинных документов и видео.