Каталог моделей
🧠 Мультимодальная💬 Текст💻 Код API Open Source

Llama 4 Scout

MetaДата выхода: 5 апр 2025Контекст: 10M tokens Сайт

MoE-модель Meta с 16 экспертами. 109B параметров, 17B активных. Рекордный контекст 10 миллионов токенов. Текст, изображения, видео. 40 трлн токенов обучения, 200 языков. Llama 4 Community License.

Тарифы

OpenRouter
$0.08/1M input
  • $0.30/1M output
  • 10M контекст
Self-hosted
Бесплатно
  • Открытые веса
  • HuggingFace

Плюсы и минусы

Плюсы

  • Рекордный контекст 10M токенов
  • MoE: 17B из 109B активны — низкая стоимость
  • Нативная мультимодальность
  • Открытые веса

Минусы

  • Реальный контекст через API ~328K
  • Лицензия не OSI — ограничение 700M MAU
  • Уступает крупным моделям в рассуждениях
  • Высокие требования к памяти

Подробный обзор

Что такое Llama 4 Scout

Llama 4 Scout — мультимодальная MoE-модель от Meta с рекордным контекстным окном 10 миллионов токенов. 109B общих параметров с 16 экспертами, из которых только 17B активны на каждом токене. Обучена на 40 триллионах токенов на 200 языках.

Архитектура iRoPE с чередованием NoPE-слоёв позволила достичь 10M контекста при обучении на 256K. Поддерживает текст, изображения и видео на входе. Лицензия Llama 4 Community — бесплатна до 700 миллионов MAU.

Ключевые возможности

10M токенов контекста — это примерно 7500 страниц текста. MMLU Pro 74.3%. Через API-провайдеров реальный лимит ~328K из-за серверных ограничений, но self-hosted позволяет использовать полный контекст. MoE с 16 экспертами обеспечивает низкую стоимость инференса: $0.08/1M input через OpenRouter.

Сравнение с конкурентами

Scout vs Maverick: Scout экономичнее (16 экспертов, $0.30/1M output), Maverick мощнее (128 экспертов, $0.60/1M output). По контексту Scout уникален — 10M токенов не предлагает ни одна другая открытая модель. Gemini 3.1 Pro имеет 2M контекст, Claude Opus 4.6 — 1M.

Как начать использовать

API через OpenRouter, Together AI, Fireworks AI или GroqCloud. Self-hosted — скачать веса с HuggingFace (meta-llama/Llama-4-Scout-17B-16E-Instruct), запустить через vLLM или Ollama.

Вопросы и ответы

Контекст 10M реально работает?+
Обучена до 10M, но API-провайдеры ограничивают ~328K.
Чем отличается от Maverick?+
Scout — 16 экспертов, 10M контекст. Maverick — 128 экспертов, 1M контекст, мощнее.
Бесплатно?+
Веса открыты. Коммерчески бесплатно до 700M MAU.
Какие языки?+
12 языков, обучена на 200.

Похожие модели

Текст

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Бесплатно
Текст

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

$0.05/1M input
Мультимодальная

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

$20/мес
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно

Используете Llama 4 Scout?

Поделитесь опытом в нашем сообществе

Написать пост