💬 Текст💻 Код API Open Source

Mixtral 8x22B

Mistral AIДата выхода: 17 апр 2024Контекст: 64K Сайт

Мощная открытая модель-смесь экспертов (MoE) от Mistral AI с 141 млрд параметров. Флагман открытого источника с контекстом 64K и сильными показателями в коде и рассуждениях.

—

Тарифы

Бесплатно

false

input

$—

$0.90 за 1M токенов

output

$—

$0.90 за 1M токенов

selfHosted

$—

бесплатно при самостоятельном развёртывании

Плюсы и минусы

Плюсы

Открытый исходный код — можно развернуть на собственных серверах
141 млрд параметров при активации только 39 млрд — высокая эффективность
Контекстное окно 64K токенов — обработка длинных документов
Лидирующие показатели на бенчмарках среди открытых моделей
Поддержка 5 языков: английский, французский, немецкий, испанский, итальянский

Минусы

Требует значительных ресурсов для самостоятельного развёртывания (2x A100)
Качество работы с русским языком ниже, чем у специализированных моделей
Уступает Claude Opus и GPT-4o в сложных аналитических задачах

Подробный обзор

Вопросы и ответы

Чем архитектура MoE отличается от обычного трансформера?+

В обычных трансформерах все параметры активируются для каждого токена. В архитектуре MoE модель разделена на несколько экспертных блоков, и маршрутизатор выбирает только 2–4 из них для каждого токена. Это позволяет иметь большое число параметров, активируя лишь часть при каждом вычислении.

Какое железо нужно для запуска Mixtral 8x22B?+

Для работы с Mixtral 8x22B в формате float16 требуется примерно 280 ГБ видеопамяти — например, 4x NVIDIA A100 80GB. С квантизацией до 4-bit требования снижаются до 60–80 ГБ, что позволяет запустить модель на 2x A100 40GB или 4x RTX 4090.

Можно ли использовать Mixtral 8x22B бесплатно?+

Да, поскольку модель открытая (Apache 2.0), её можно скачать с Hugging Face и запустить бесплатно на собственном оборудовании. Через API Mistral AI тарификация составляет $0.90 за 1M токенов как для входящих, так и для исходящих токенов.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно

Код

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Код

DeepSeek Coder V2

DeepSeek

Открытая модель-кодировщик от DeepSeek с архитектурой MoE на 236 млрд параметров (активны 21B), поддержка 128K контекста и 338 языков программирования.

Бесплатно

Текст

GLM-5.1

Zhipu AI

Флагманская агентная модель для кодинга. 744B параметров MoE, 40B активных. Обучена на чипах Huawei Ascend 910B. Лидер SWE-Bench Pro (58.4%). Поддерживает 600+ итераций без деградации. MIT лицензия. Максимальный output 128K токенов.

$0.95/1M input

Используете Mixtral 8x22B?

Поделитесь опытом в нашем сообществе

Написать пост