💬 Текст💻 Код🧠 Мультимодальная API Open Source

Qwen 2.5 72B

Alibaba CloudДата выхода: 19 сен 2024Контекст: 128K Сайт

Открытая языковая модель Alibaba Cloud с 72 млрд параметров, поддерживает 128K токенов контекста и более 29 языков, включая русский.

—

Тарифы

Бесплатно

Бесплатно (open source, self-hosted)

Платный

$—

Через API Alibaba Cloud от $0.4/1M токенов

Плюсы и минусы

Плюсы

Один из сильнейших открытых чекпоинтов в классе 70B+ по бенчмаркам MMLU и HumanEval
Поддержка 29+ языков с высоким качеством русскоязычного вывода
Контекстное окно 128K токенов — в 2 раза больше большинства аналогов в классе
Эффективная работа с кодом: занимает лидирующие позиции среди открытых моделей на HumanEval (86%+)
Можно развернуть локально через Ollama, llama.cpp или vLLM

Минусы

Требует от 48 ГБ VRAM для полной загрузки в fp16 — необходима мощная видеокарта
Скорость инференса на локальном железе уступает закрытым облачным решениям
Менее стабильна в следовании сложным структурированным инструкциям по сравнению с GPT-4o

Подробный обзор

Вопросы и ответы

Чем Qwen 2.5 72B отличается от LLaMA 3.1 70B?+

Qwen 2.5 72B превосходит LLaMA 3.1 70B на большинстве академических бенчмарков, особенно в задачах кодирования и математики. Ключевые преимущества: более широкая многоязычная поддержка (29+ языков против 8), большее контекстное окно (128K против 128K, но с лучшим recall на дальних дистанциях), и улучшенное следование структурированным инструкциям. LLaMA 3.1 может быть предпочтительнее в задачах на английском языке и имеет более развитую экосистему инструментов.

Можно ли запустить Qwen 2.5 72B на обычном компьютере?+

В полном fp16-формате модель требует около 144 ГБ RAM/VRAM, что недоступно для большинства персональных компьютеров. Однако квантованные версии значительно снижают требования: Q4_K_M весит ~41 ГБ и работает на системе с 48 ГБ оперативной памяти (CPU offload через llama.cpp). Для комфортной работы рекомендуется GPU с 48+ ГБ VRAM или несколько потребительских видеокарт суммарным объёмом 40+ ГБ.

Поддерживает ли Qwen 2.5 72B работу с изображениями?+

Базовая версия Qwen 2.5 72B работает только с текстом. Для работы с изображениями существует отдельная мультимодальная версия Qwen2-VL, которая поддерживает анализ изображений, документов и видео. Qwen2-VL доступна в версиях 2B, 7B и 72B.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно

Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно

Мультимодальная

Muse Spark

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Используете Qwen 2.5 72B?

Поделитесь опытом в нашем сообществе

Написать пост