Каталог моделей
🧠 Мультимодальная💬 Текст💻 Код API Open Source

Gemma 4

Google DeepMindДата выхода: 2 апр 2026Контекст: 256K tokens Сайт

Семейство открытых мультимодальных моделей Google. 4 варианта от 2.3B до 31B. Текст, изображения, аудио, видео. 31B Dense — #3 в Arena AI. Apache 2.0, 140+ языков, function calling.

Тарифы

OpenRouter 26B
$0.08/1M input
  • 0.35/1M output
  • Мультимодальность
Self-hosted
Бесплатно
  • Apache 2.0
  • Открытые веса

Плюсы и минусы

Плюсы

  • Полностью открытая Apache 2.0
  • Мультимодальность из коробки
  • MoE 26B: 3.8B активных — запуск на потребительском GPU
  • 140+ языков и function calling

Минусы

  • Нет генерации изображений — только анализ
  • 31B Dense требует H100 80GB
  • Уступает GPT-5 и Claude Opus
  • Edge-модели ограничены 128K контекстом

Подробный обзор

Что такое Gemma 4

Gemma 4 — семейство открытых мультимодальных моделей от Google DeepMind, выпущенное в апреле 2026 года. Включает четыре варианта: компактные E2B и E4B для мобильных устройств, эффективную MoE-модель 26B (только 3.8B активных параметров) и флагманскую 31B Dense, занявшую третье место в мировом рейтинге Arena AI среди открытых моделей.

Все модели выпущены под лицензией Apache 2.0 — полностью свободны для коммерческого использования. Поддержка 140+ языков, нативная мультимодальность (текст, изображения, аудио, видео), встроенный вызов функций и режим рассуждений.

Ключевые возможности

Архитектура Gemma 4 построена на технологиях Gemini. 31B Dense показывает 85.2% на MMLU Pro, 89.2% на AIME 2026 и 80% на LiveCodeBench. MoE-вариант 26B активирует лишь 3.8B параметров на токен, что делает инференс в 3-4 раза дешевле при сопоставимом качестве.

Контекстное окно: 128K для компактных моделей и 256K для 26B/31B. Нативная поддержка изображений, аудио и видео на входе. Встроенный function calling для интеграции с внешними API и инструментами.

Для кого подходит

Разработчики, которым нужна мощная открытая модель без лицензионных ограничений. E2B/E4B работают на смартфонах и Raspberry Pi. 26B MoE — на потребительских GPU (RTX 4090). 31B Dense — на серверах с H100.

Сравнение с конкурентами

По сравнению с Llama 4 Scout (Meta), Gemma 4 имеет меньший контекст (256K vs 10M), но лучше показывает себя на бенчмарках качества. В отличие от Qwen 3, Gemma 4 нативно мультимодальна (аудио + видео). Apache 2.0 лицензия Gemma не имеет ограничений по MAU, в отличие от Llama 4 Community License (700M MAU).

Как начать использовать

Через Google AI Studio (ai.google.dev) — бесплатный API с генеративным SDK. Через OpenRouter — $0.08/1M input для 26B. Локально — скачать веса с HuggingFace и запустить через Ollama, vLLM или SGLang.

Вопросы и ответы

Можно ли коммерчески?+
Да, Apache 2.0 без ограничений.
Поддерживает русский?+
Да, 140+ языков.
Можно локально?+
Да, от смартфонов до H100.
26B vs 31B?+
26B — дешевле (3.8B активных), 31B — качественнее.

Похожие модели

Текст

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Бесплатно
Текст

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

$0.05/1M input
Мультимодальная

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

$20/мес
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно

Используете Gemma 4?

Поделитесь опытом в нашем сообществе

Написать пост