Каталог моделей
🎨 Изображения API Open Source

Stable Diffusion 3.5

Stability AIДата выхода: 22 окт 2024 Сайт

Семейство открытых моделей генерации изображений на MMDiT. Large (8.1B), Large Turbo (4 шага инференса) и Medium (2.5B, 9.9 ГБ VRAM). Типографика, сложные промпты. Бесплатно для коммерческого использования до $1M выручки.

Тарифы

API Medium
$0.035/изображение
  • 3.5 кредитов
Self-hosted
Бесплатно
  • Community License
  • До $1M выручки

Плюсы и минусы

Плюсы

  • Открытые веса — локальный запуск, LoRA, дообучение
  • Medium работает на 9.9 ГБ VRAM
  • Large Turbo — 4 шага с сохранением качества
  • Бесплатно до $1M выручки

Минусы

  • Лицензия ограничивает бесплатное использование $1M
  • Large — 8.1B параметров, нужна мощная GPU
  • Уступает Midjourney в фотореализме
  • Stability AI — финансовые трудности

Подробный обзор

Что такое Stable Diffusion 3.5

Stable Diffusion 3.5 — семейство открытых моделей генерации изображений от Stability AI на архитектуре MMDiT (Multimodal Diffusion Transformer). Три варианта: Large (8.1B параметров), Large Turbo (ускоренная генерация за 4 шага) и Medium (2.5B, от 9.9 ГБ VRAM).

Ключевые возможности

Улучшенная типографика — корректный рендеринг текста на изображениях. Понимание сложных композиционных промптов. Large Turbo генерирует за 4 шага с минимальной потерей качества. Medium запускается на потребительских GPU с 9.9 ГБ VRAM (RTX 3060, RTX 4060).

Community License — бесплатно для коммерческого использования при выручке до $1M/год. Поддержка LoRA-адаптеров, дообучение на собственных данных. Веса на HuggingFace.

Сравнение с конкурентами

В отличие от DALL-E 3 и Midjourney, SD 3.5 можно запустить локально и дообучить. Medium-версия работает на обычном GPU, тогда как FLUX 2.0 требует минимум 16 ГБ VRAM. По качеству фотореализма уступает Midjourney v8, но превосходит в стилизации и контроле.

Как начать

Скачать веса с HuggingFace (stabilityai/stable-diffusion-3.5-large или medium). Запустить через ComfyUI, Automatic1111 или Stability AI API ($0.035/изображение). Для дообучения — используйте LoRA с kohya_ss.

Вопросы и ответы

Large, Turbo или Medium?+
Large — макс качество. Turbo — быстрая генерация. Medium — для обычного GPU.
Коммерчески бесплатно?+
Да, при выручке менее $1M/год. Крупным — Enterprise License.
Сколько VRAM?+
Medium — от 9.9 ГБ. Large — от 16-24 ГБ.
Где скачать?+
HuggingFace: stabilityai/stable-diffusion-3.5-large и medium.

Похожие модели

Изображения

DALL-E 3

OpenAI

DALL-E 3 — флагманская модель генерации изображений OpenAI, интегрированная в ChatGPT. Точно следует текстовым описаниям, поддерживает HD-разрешение 1024×1024 до 1792×1024.

Бесплатно
Изображения

Nano Banana Pro

Google

Премиум image-модель Google из линейки Gemini 3 Pro. Флагман Google на рынке генерации картинок в 2026: лучшая в индустрии точность промпта, работа со сложными сценами и текстовыми элементами, разрешение до 4K. Преемник популярной Nano Banana.

$0.134изображение
Изображения

Midjourney v8

Midjourney

Флагманская модель Midjourney для генерации изображений. V8 Alpha вышла 17 марта 2026 — полностью переписанный движок, генерация в 5 раз быстрее V7, нативное разрешение 2K без апскейла, значительно улучшенный рендеринг текста и точность следования промптам. Переход с TPU на GPU и PyTorch. Лучшая модель для художественной и коммерческой генерации изображений

$10/мес
Изображения

Nano Banana

Google

Image-модель Google из линейки Gemini 2.5 Flash — быстрая и точная генерация картинок по тексту. Известна под кодовым именем Nano Banana: задаёт новый стандарт качества в бюджетном сегменте за счёт отличного следования промпту, 2K-разрешения и редактирования на входе текст + картинка.

Бесплатно
Изображения

Ideogram 3.0

Ideogram

Генератор изображений с лучшим в индустрии рендерингом текста (90-95% точность). Style Reference для консистентного стиля, Magic Fill для редактирования. 25 бесплатных изображений в день.

Бесплатно

Используете Stable Diffusion 3.5?

Поделитесь опытом в нашем сообществе

Написать пост