🧠 Мультимодальная💬 Текст💻 Код API Open Source

Llama 4 Maverick

MetaДата выхода: 5 апр 2025Контекст: 1M tokens Сайт

Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.

—

Тарифы

OpenRouter

$0.15/1M input

$0.60/1M output
128 экспертов
1M контекст

Self-hosted

Бесплатно

Открытые веса

Плюсы и минусы

Плюсы

Превосходит GPT-4o и Gemini 2.0 Flash
128 экспертов при 17B активных
Контекст 1M токенов
Помещается на одном H100

Минусы

400B параметров — высокие требования к памяти
Лицензия не OSI — ограничение 700M MAU
Данные с cutoff август 2024
Дороже Scout

Подробный обзор

Что такое Llama 4 Maverick

Llama 4 Maverick — флагманская MoE-модель Meta со 128 экспертами. 400B общих параметров, 17B активных на токен. Контекст 1 миллион токенов. Превосходит GPT-4o и Gemini 2.0 Flash по широкому набору бенчмарков. ELO 1417 на LMSYS Arena.

Ключевые возможности

MMLU Pro 80.5%, сопоставим с DeepSeek v3 при вдвое меньшем числе активных параметров. 128 экспертов дают доступ к огромной базе знаний при маршрутизации. Нативная мультимодальность: анализ текста, изображений и видео. Помещается на одном узле H100.

Сравнение с конкурентами

Maverick занимает нишу между открытыми и проприетарными моделями. Дешевле Claude Sonnet 4.6 ($0.60 vs $3/1M output) при сопоставимом качестве на общих задачах. Уступает Claude Opus 4.6 и GPT-5.4 на сложных рассуждениях, но значительно дешевле.

Как начать

API: OpenRouter ($0.15/$0.60 per 1M), Together AI, Google Vertex AI. Self-hosted: HuggingFace, Ollama. Для полного контекста 1M рекомендуется H100 с 80GB VRAM.

Вопросы и ответы

Почему мощнее Scout при тех же 17B?+

128 экспертов дают доступ к 400B параметров — более специализированные знания.

Для каких задач?+

Сложные рассуждения, кодинг, глубокий анализ.

Локально?+

Да, на одном H100 через Ollama.

Генерирует изображения?+

Нет, только анализирует. Генерирует текст и код.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно

Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно

Мультимодальная

Muse Spark

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Используете Llama 4 Maverick?

Поделитесь опытом в нашем сообществе

Написать пост

Что такое Llama 4 Maverick

Ключевые возможности

Сравнение с конкурентами

Как начать

API: OpenRouter ($0.15/$0.60 per 1M), Together AI, Google Vertex AI. Self-hosted: HuggingFace, Ollama. Для полного контекста 1M рекомендуется H100 с 80GB VRAM.