Claude Haiku 4.5 vs Gemma 4 — сравнение бенчмарков

Claude Haiku 4.5

Claude Haiku 4.5 превосходит Gemma 4 по следованию инструкциям и безопасности, хотя Gemma 4 выигрывает за счёт возможности локального развёртывания.

Бенчмарки

MMLU

Claude

Gemma

HumanEval

Claude

Gemma

MATH

Claude

Gemma

Arena Elo

Claude

1210

Gemma

1155

Средний балл: Claude 358.5vsGemma 340

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Haiku 4.5

Anthropic

Быстрая и экономичная модель Anthropic. 200K контекст, до 64K выход. Extended thinking, computer use, context awareness. Производительность уровня Claude Sonnet 4 в 3 раза дешевле. Скорость в 4-5 раз выше Sonnet 4.5.

Тарифы, обзор, бенчмарки →

Gemma 4

Google DeepMind

Семейство открытых мультимодальных моделей Google. 4 варианта от 2.3B до 31B. Текст, изображения, аудио, видео. 31B Dense — #3 в Arena AI. Apache 2.0, 140+ языков, function calling.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Gemma 4 — открытая модель?+

Да, Gemma 4 от Google распространяется с открытыми весами и может быть развёрнута локально или на собственных серверах.

Haiku 4.5 лучше Gemma 4?+

По большинству бенчмарков Haiku 4.5 превосходит Gemma 4: MMLU 82 vs 75, HumanEval 74 vs 67.

Gemma 4 бесплатна для коммерческого использования?+

Да, Gemma 4 доступна по лицензии, разрешающей коммерческое использование. Haiku оплачивается по API.

Когда выбрать Gemma 4?+

Для приватных приложений с локальным развёртыванием или при ограниченном бюджете Gemma 4 — отличный выбор.