💬 Текст💻 Код🧠 Мультимодальная API Open Source

Qwen 3

Alibaba CloudДата выхода: 28 апр 2025Контекст: 128K tokens Сайт

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

—

Тарифы

OpenRouter 8B

$0.05/1M input

$0.40/1M output
128K контекст

Qwen3-Max

$0.78/1M input

$3.90/1M output
Максимум

Self-hosted

Бесплатно

Apache 2.0
vLLM, Ollama

Плюсы и минусы

Плюсы

Apache 2.0 — полностью open source
119 языков включая русский
MoE 235B: только 22B активных — экономно
Обгоняет o3-mini и Gemini 2.5 Pro

Минусы

Крупные модели требуют мощной GPU
Контекст базовых моделей 32K
MoE сложнее в деплое
Экосистема слабее OpenAI/Anthropic

Подробный обзор

Что такое Qwen 3

Qwen 3 — серия LLM от Alibaba Cloud с гибридным рассуждением. 8 моделей: 6 плотных (0.6B, 1.7B, 4B, 8B, 14B, 32B) и 2 MoE (30B/3B активных и флагманская 235B/22B). Обучена на 36 триллионах токенов, поддерживает 119 языков. Apache 2.0.

Ключевые возможности

Гибридное мышление: модель автоматически переключается между «думающим» режимом для сложных задач (как o3) и быстрым для простых. AIME 89.7%, GPQA 56.1%, Codeforces 94.2%. Qwen3-235B обгоняет o3-mini и Gemini 2.5 Pro на ряде бенчмарков.

MoE 235B использует только 22B активных параметров — экономичный инференс. Контекст 128K для моделей 8B+. API через OpenRouter от $0.05/1M input (8B). Полностью open source под Apache 2.0.

Сравнение с конкурентами

Qwen3-235B при 22B активных параметрах сопоставим с GPT-4o по качеству, но значительно дешевле. В отличие от Llama 4, лицензия Apache 2.0 не имеет ограничений по MAU. 119 языков — больше чем у любой другой открытой модели. Русский язык поддерживается нативно.

Как начать

Локально: скачать с HuggingFace, запустить через Ollama или vLLM. Qwen3-8B — оптимальный выбор для домашнего ПК. API: OpenRouter, DashScope (Alibaba), Together AI. Документация на github.com/QwenLM/Qwen3.

Вопросы и ответы

Бесплатный?+

Да, Apache 2.0. Через API — оплата по токенам.

Для локального запуска?+

8B или 4B для домашнего ПК. 32B или 235B для серверов.

Русский?+

Да, 119 языков.

Гибридное рассуждение?+

Думает над сложными задачами, быстро отвечает на простые — автоматически.

Похожие модели

Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно

Мультимодальная

Muse Spark

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Мультимодальная

Qwen 3

Тарифы

Плюсы и минусы

Плюсы

Минусы

Подробный обзор

Что такое Qwen 3

Ключевые возможности

Сравнение с конкурентами

Как начать

Вопросы и ответы

Похожие модели

GPT-5.4

Muse Spark

Cursor Agent

Windsurf

Llama 3.1 405B

Используете Qwen 3?

Qwen 3

Тарифы

Плюсы и минусы

Плюсы

Минусы

Подробный обзор

Что такое Qwen 3

Ключевые возможности

Сравнение с конкурентами

Как начать

Вопросы и ответы

Похожие модели

GPT-5.4

Muse Spark

Cursor Agent

Windsurf

Llama 3.1 405B

Используете Qwen 3?