🎨 Изображения API Open Source

Stable Diffusion 3.5

Stability AIДата выхода: 22 окт 2024 Сайт

Семейство открытых моделей генерации изображений на MMDiT. Large (8.1B), Large Turbo (4 шага инференса) и Medium (2.5B, 9.9 ГБ VRAM). Типографика, сложные промпты. Бесплатно для коммерческого использования до $1M выручки.

—

Тарифы

API Medium

$0.035/изображение

3.5 кредитов

Self-hosted

Бесплатно

Community License
До $1M выручки

Плюсы и минусы

Плюсы

Открытые веса — локальный запуск, LoRA, дообучение
Medium работает на 9.9 ГБ VRAM
Large Turbo — 4 шага с сохранением качества
Бесплатно до $1M выручки

Минусы

Лицензия ограничивает бесплатное использование $1M
Large — 8.1B параметров, нужна мощная GPU
Уступает Midjourney в фотореализме
Stability AI — финансовые трудности

Подробный обзор

Вопросы и ответы

Large, Turbo или Medium?+

Large — макс качество. Turbo — быстрая генерация. Medium — для обычного GPU.

Коммерчески бесплатно?+

Да, при выручке менее $1M/год. Крупным — Enterprise License.

Сколько VRAM?+

Medium — от 9.9 ГБ. Large — от 16-24 ГБ.

Где скачать?+

HuggingFace: stabilityai/stable-diffusion-3.5-large и medium.

Похожие модели

Изображения

ChatGPT Images 2.0

OpenAI

Флагманская модель OpenAI для генерации изображений внутри ChatGPT. Умеет искать в интернете перед созданием картинки, генерировать несколько вариантов из одного промпта и проверять результат. Разрешение до 2K, корректный рендеринг текста внутри изображений, поддержка нескольких соотношений сторон. Подходит для маркетинговых материалов, журнальных макетов и многопанельных комиксов

$20/мес

Изображения

YandexART 2.0

Яндекс

Генеративная модель изображений от Яндекса. Умеет рисовать читаемый текст на картинках, понимает промпты на русском. Каскадная диффузия и гибридная архитектура для точного следования описанию.

Бесплатно

Изображения

Recraft V3

Recraft

Модель генерации векторной и растровой графики, занявшая первое место в Imagen Arena по качеству рендеринга текста. Поддерживает SVG-вывод, брендинг и дизайн-системы.

Бесплатно

Изображения

DALL-E 3

OpenAI

DALL-E 3 — флагманская модель генерации изображений OpenAI, интегрированная в ChatGPT. Точно следует текстовым описаниям, поддерживает HD-разрешение 1024×1024 до 1792×1024.

Бесплатно

Изображения

Nano Banana Pro

Google

Премиум image-модель Google из линейки Gemini 3 Pro. Флагман Google на рынке генерации картинок в 2026: лучшая в индустрии точность промпта, работа со сложными сценами и текстовыми элементами, разрешение до 4K. Преемник популярной Nano Banana.

$0.134изображение

Используете Stable Diffusion 3.5?

Поделитесь опытом в нашем сообществе

Написать пост