Qwen 3
Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.
Тарифы
- $0.40/1M output
- 128K контекст
- $3.90/1M output
- Максимум
- Apache 2.0
- vLLM, Ollama
Плюсы и минусы
Плюсы
- Apache 2.0 — полностью open source
- 119 языков включая русский
- MoE 235B: только 22B активных — экономно
- Обгоняет o3-mini и Gemini 2.5 Pro
Минусы
- Крупные модели требуют мощной GPU
- Контекст базовых моделей 32K
- MoE сложнее в деплое
- Экосистема слабее OpenAI/Anthropic
Подробный обзор
Что такое Qwen 3
Qwen 3 — серия LLM от Alibaba Cloud с гибридным рассуждением. 8 моделей: 6 плотных (0.6B, 1.7B, 4B, 8B, 14B, 32B) и 2 MoE (30B/3B активных и флагманская 235B/22B). Обучена на 36 триллионах токенов, поддерживает 119 языков. Apache 2.0.
Ключевые возможности
Гибридное мышление: модель автоматически переключается между «думающим» режимом для сложных задач (как o3) и быстрым для простых. AIME 89.7%, GPQA 56.1%, Codeforces 94.2%. Qwen3-235B обгоняет o3-mini и Gemini 2.5 Pro на ряде бенчмарков.
MoE 235B использует только 22B активных параметров — экономичный инференс. Контекст 128K для моделей 8B+. API через OpenRouter от $0.05/1M input (8B). Полностью open source под Apache 2.0.
Сравнение с конкурентами
Qwen3-235B при 22B активных параметрах сопоставим с GPT-4o по качеству, но значительно дешевле. В отличие от Llama 4, лицензия Apache 2.0 не имеет ограничений по MAU. 119 языков — больше чем у любой другой открытой модели. Русский язык поддерживается нативно.
Как начать
Локально: скачать с HuggingFace, запустить через Ollama или vLLM. Qwen3-8B — оптимальный выбор для домашнего ПК. API: OpenRouter, DashScope (Alibaba), Together AI. Документация на github.com/QwenLM/Qwen3.