Claude Haiku 4.5 vs Gemini 3.1 Pro — сравнение бенчмарков
Gemini 3.1 Pro превосходит Claude Haiku 4.5 по возможностям мультимодальности и длинному контексту, хотя Haiku быстрее и дешевле.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Claude Haiku 4.5 и Gemini 3.1 Pro конкурируют в сегменте мощных языковых моделей среднего уровня. Gemini 3.1 Pro от Google обладает огромным контекстным окном (до 2М токенов) и развитыми мультимодальными возможностями. Haiku 4.5 ориентирован на скорость и экономичность.
По бенчмаркам Gemini 3.1 Pro лидирует: MMLU 89 vs 82, HumanEval 84 vs 74, Arena Elo 1295 vs 1210. Для задач, требующих анализа длинных документов, видео и изображений, Gemini 3.1 Pro значительно предпочтительнее. Haiku выигрывает в сценариях с высокой частотой коротких запросов.
Быстрая и экономичная модель Anthropic. 200K контекст, до 64K выход. Extended thinking, computer use, context awareness. Производительность уровня Claude Sonnet 4 в 3 раза дешевле. Скорость в 4-5 раз выше Sonnet 4.5.
Тарифы, обзор, бенчмарки →Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.
Тарифы, обзор, бенчмарки →