Gemma 4 vs Grok 3 — сравнение бенчмарков

Grok 3

Grok 3 превосходит Gemma 4 по всем ключевым бенчмаркам. Gemma 4 выигрывает за счёт открытых весов, бесплатного доступа и возможности локального запуска.

Бенчмарки

MMLU

Gemma

81.2

Grok

87.9

HumanEval

Gemma

79.5

Grok

88.5

Arena Elo

Gemma

1175

Grok

1300

Средний балл: Gemma 445.2vsGrok 492.1

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Gemma 4

Google DeepMind

Семейство открытых мультимодальных моделей Google. 4 варианта от 2.3B до 31B. Текст, изображения, аудио, видео. 31B Dense — #3 в Arena AI. Apache 2.0, 140+ языков, function calling.

Тарифы, обзор, бенчмарки →

Grok 3

xAI

Флагманская модель от xAI (Илон Маск). Контекст 131K токенов, режим рассуждений, интеграция с X (Twitter) для доступа к данным в реальном времени. Минимальная цензура среди фронтирных моделей.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Что такое Grok 3?+

Grok 3 — языковая модель от xAI (компания Илона Маска), интегрированная с X (Twitter) и имеющая доступ к информации в реальном времени.

Gemma 4 или Grok 3 — что мощнее?+

Grok 3 мощнее по всем бенчмаркам, но Gemma 4 бесплатна и работает локально без ограничений API.

Сколько стоит Grok 3?+

Grok 3 доступен в X Premium+ за 16 долларов в месяц или через API xAI.

Поддерживает ли Grok 3 русский язык?+

Grok 3 поддерживает русский язык, но специализируется на английском. Для русскоязычных задач Gemma 4 с доообучением может быть предпочтительнее.