Флагманская MoE-модель Meta со 128 экспертами. 400B параметров, 17B активных. Контекст 1M токенов. Превосходит GPT-4o и Gemini 2.0 Flash. Сопоставима с DeepSeek v3 при вдвое меньшем числе активных параметров.
Llama 4 Maverick — флагманская MoE-модель Meta со 128 экспертами. 400B общих параметров, 17B активных на токен. Контекст 1 миллион токенов. Превосходит GPT-4o и Gemini 2.0 Flash по широкому набору бенчмарков. ELO 1417 на LMSYS Arena.
MMLU Pro 80.5%, сопоставим с DeepSeek v3 при вдвое меньшем числе активных параметров. 128 экспертов дают доступ к огромной базе знаний при маршрутизации. Нативная мультимодальность: анализ текста, изображений и видео. Помещается на одном узле H100.
Maverick занимает нишу между открытыми и проприетарными моделями. Дешевле Claude Sonnet 4.6 ($0.60 vs $3/1M output) при сопоставимом качестве на общих задачах. Уступает Claude Opus 4.6 и GPT-5.4 на сложных рассуждениях, но значительно дешевле.
API: OpenRouter ($0.15/$0.60 per 1M), Together AI, Google Vertex AI. Self-hosted: HuggingFace, Ollama. Для полного контекста 1M рекомендуется H100 с 80GB VRAM.