Каталог моделей
🧠 Мультимодальная💬 Текст💻 Код API Open Source

Llama 4 Maverick

MetaДата выхода: 5 апр 2025Контекст: 1M tokens Сайт

Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.

Тарифы

OpenRouter
$0.15/1M input
  • $0.60/1M output
  • 128 экспертов
  • 1M контекст
Self-hosted
Бесплатно
  • Открытые веса

Плюсы и минусы

Плюсы

  • Превосходит GPT-4o и Gemini 2.0 Flash
  • 128 экспертов при 17B активных
  • Контекст 1M токенов
  • Помещается на одном H100

Минусы

  • 400B параметров — высокие требования к памяти
  • Лицензия не OSI — ограничение 700M MAU
  • Данные с cutoff август 2024
  • Дороже Scout

Подробный обзор

Что такое Llama 4 Maverick

Llama 4 Maverick — флагманская MoE-модель Meta со 128 экспертами. 400B общих параметров, 17B активных на токен. Контекст 1 миллион токенов. Превосходит GPT-4o и Gemini 2.0 Flash по широкому набору бенчмарков. ELO 1417 на LMSYS Arena.

Ключевые возможности

MMLU Pro 80.5%, сопоставим с DeepSeek v3 при вдвое меньшем числе активных параметров. 128 экспертов дают доступ к огромной базе знаний при маршрутизации. Нативная мультимодальность: анализ текста, изображений и видео. Помещается на одном узле H100.

Сравнение с конкурентами

Maverick занимает нишу между открытыми и проприетарными моделями. Дешевле Claude Sonnet 4.6 ($0.60 vs $3/1M output) при сопоставимом качестве на общих задачах. Уступает Claude Opus 4.6 и GPT-5.4 на сложных рассуждениях, но значительно дешевле.

Как начать

API: OpenRouter ($0.15/$0.60 per 1M), Together AI, Google Vertex AI. Self-hosted: HuggingFace, Ollama. Для полного контекста 1M рекомендуется H100 с 80GB VRAM.

Вопросы и ответы

Почему мощнее Scout при тех же 17B?+
128 экспертов дают доступ к 400B параметров — более специализированные знания.
Для каких задач?+
Сложные рассуждения, кодинг, глубокий анализ.
Локально?+
Да, на одном H100 через Ollama.
Генерирует изображения?+
Нет, только анализирует. Генерирует текст и код.

Похожие модели

Текст

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Бесплатно
Текст

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

$0.05/1M input
Мультимодальная

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

$20/мес
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно

Используете Llama 4 Maverick?

Поделитесь опытом в нашем сообществе

Написать пост