Каталог моделей
💬 Текст💻 Код🧠 Мультимодальная API Open Source

Qwen 3

Alibaba CloudДата выхода: 28 апр 2025Контекст: 128K tokens Сайт

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

Тарифы

OpenRouter 8B
$0.05/1M input
  • $0.40/1M output
  • 128K контекст
Qwen3-Max
$0.78/1M input
  • $3.90/1M output
  • Максимум
Self-hosted
Бесплатно
  • Apache 2.0
  • vLLM, Ollama

Плюсы и минусы

Плюсы

  • Apache 2.0 — полностью open source
  • 119 языков включая русский
  • MoE 235B: только 22B активных — экономно
  • Обгоняет o3-mini и Gemini 2.5 Pro

Минусы

  • Крупные модели требуют мощной GPU
  • Контекст базовых моделей 32K
  • MoE сложнее в деплое
  • Экосистема слабее OpenAI/Anthropic

Подробный обзор

Что такое Qwen 3

Qwen 3 — серия LLM от Alibaba Cloud с гибридным рассуждением. 8 моделей: 6 плотных (0.6B, 1.7B, 4B, 8B, 14B, 32B) и 2 MoE (30B/3B активных и флагманская 235B/22B). Обучена на 36 триллионах токенов, поддерживает 119 языков. Apache 2.0.

Ключевые возможности

Гибридное мышление: модель автоматически переключается между «думающим» режимом для сложных задач (как o3) и быстрым для простых. AIME 89.7%, GPQA 56.1%, Codeforces 94.2%. Qwen3-235B обгоняет o3-mini и Gemini 2.5 Pro на ряде бенчмарков.

MoE 235B использует только 22B активных параметров — экономичный инференс. Контекст 128K для моделей 8B+. API через OpenRouter от $0.05/1M input (8B). Полностью open source под Apache 2.0.

Сравнение с конкурентами

Qwen3-235B при 22B активных параметрах сопоставим с GPT-4o по качеству, но значительно дешевле. В отличие от Llama 4, лицензия Apache 2.0 не имеет ограничений по MAU. 119 языков — больше чем у любой другой открытой модели. Русский язык поддерживается нативно.

Как начать

Локально: скачать с HuggingFace, запустить через Ollama или vLLM. Qwen3-8B — оптимальный выбор для домашнего ПК. API: OpenRouter, DashScope (Alibaba), Together AI. Документация на github.com/QwenLM/Qwen3.

Вопросы и ответы

Бесплатный?+
Да, Apache 2.0. Через API — оплата по токенам.
Для локального запуска?+
8B или 4B для домашнего ПК. 32B или 235B для серверов.
Русский?+
Да, 119 языков.
Гибридное рассуждение?+
Думает над сложными задачами, быстро отвечает на простые — автоматически.

Похожие модели

Текст

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Бесплатно
Мультимодальная

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

$20/мес
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно
Мультимодальная

GPT-4o

OpenAI

GPT-4o — мультимодальная флагманская модель OpenAI с нативной обработкой текста, изображений и аудио. Выпущена в мае 2024 года, стала стандартом качества для сложных задач.

Бесплатно

Используете Qwen 3?

Поделитесь опытом в нашем сообществе

Написать пост