Каталог моделей
🎨 Изображения API

DALL-E 3

OpenAIДата выхода: 2 окт 2023 Сайт

DALL-E 3 — флагманская модель генерации изображений OpenAI, интегрированная в ChatGPT. Точно следует текстовым описаниям, поддерживает HD-разрешение 1024×1024 до 1792×1024.

Тарифы

ChatGPT Free
Бесплатно
  • Доступ через ChatGPT с лимитами
  • Базовое разрешение 1024×1024
  • Ограниченное число генераций в день
ChatGPT Plus
$20мес
  • 50 генераций в 3 часа
  • HD режим (1024×1792, 1792×1024)
  • Более быстрая очередь
API — Standard 1024×1024
$0.040изображение
  • Прямой API доступ
  • Все соотношения сторон
  • Программная генерация
API — HD 1024×1024
$0.080изображение
  • Высокая детализация
  • Улучшенное разрешение деталей
  • Лучший результат для сложных сцен

Плюсы и минусы

Плюсы

  • Точное следование промпту — лучшее в классе на момент выхода
  • Интеграция с ChatGPT: GPT-4 автоматически улучшает промпт
  • Поддержка текста на изображениях (буквы, надписи)
  • HD режим с детализацией до 1792×1024 пикселей
  • Широкие стили: фото, масло, акварель, цифровое искусство

Минусы

  • Нет режима редактирования / inpainting через публичный API
  • Запрещает генерацию реальных людей и ряда стилей
  • $0,04–$0,08 за изображение дороже Stable Diffusion (self-hosted)
  • Максимальное разрешение ограничено 1792×1024 пикселей

Подробный обзор

DALL-E 3 — третье поколение модели генерации изображений от OpenAI, выпущенное в октябре 2023 года. Главное достижение по сравнению с DALL-E 2 — кардинально улучшенное следование текстовым описаниям: модель значительно точнее воспроизводит сложные сцены с несколькими объектами, пространственными отношениями и мелкими деталями.

Особенность DALL-E 3 в экосистеме OpenAI — нативная интеграция с GPT-4 в ChatGPT: когда пользователь описывает желаемое изображение, GPT-4 автоматически переписывает промпт, добавляя художественные детали и уточнения для получения наилучшего результата. Это снижает порог вхождения: даже короткое описание «кот в шляпе» превращается в детальный промпт с указанием стиля, освещения и композиции.

Технические характеристики и стили

DALL-E 3 поддерживает генерацию в форматах 1024×1024 (квадрат), 1024×1792 (вертикальный портрет) и 1792×1024 (горизонтальный пейзаж). HD режим ($0,08 за изображение) добавляет дополнительный проход детализации, значительно улучшая текстуры, лица и мелкие элементы. Поддерживаемые стили — vivid (насыщенный, творческий) и natural (реалистичный, приближенный к фото).

Важная особенность: DALL-E 3 умеет воспроизводить текст на изображениях — вывески, надписи на упаковке, заголовки плакатов. Это было серьёзной слабостью предыдущих генераторов изображений. Модель также хорошо справляется с инфографикой, схемами и иллюстрациями в заданном корпоративном стиле.

Доступность и ограничения

DALL-E 3 доступна через ChatGPT (Free и Plus), API OpenAI и Microsoft Copilot (Azure OpenAI). Стоимость через API: $0,04 (standard) и $0,08 (HD) за изображение — без скидок за объём. По политике безопасности модель отказывает в генерации изображений реальных людей по имени, откровенного контента и материалов, нарушающих авторские права. В сравнении с Midjourney и Stable Diffusion художественное качество DALL-E 3 ниже, но предсказуемость и точность следования промпту — выше.

Вопросы и ответы

Чем DALL-E 3 отличается от DALL-E 2?+
DALL-E 3 значительно точнее следует текстовым описаниям, особенно в сложных сценах с несколькими объектами. Добавлены HD режим, поддержка текста на изображениях и интеграция с GPT-4 для автоулучшения промптов. Максимальное разрешение выросло с 1024×1024 до 1792×1024.
Можно ли использовать DALL-E 3 через API?+
Да. Через OpenAI API модель доступна по адресу /v1/images/generations с параметром model: dall-e-3. Стоимость $0,04 (standard) или $0,08 (HD) за изображение. Поддерживаются параметры size, quality, style и n (всегда 1 для DALL-E 3).
Поддерживает ли DALL-E 3 редактирование изображений?+
Функция inpainting (редактирование части изображения) доступна только в DALL-E 2 через API. DALL-E 3 через публичный API поддерживает только генерацию с нуля. В ChatGPT Plus есть ограниченная возможность редактирования через естественный язык в диалоге.

Похожие модели

Изображения

Nano Banana Pro

Google

Премиум image-модель Google из линейки Gemini 3 Pro. Флагман Google на рынке генерации картинок в 2026: лучшая в индустрии точность промпта, работа со сложными сценами и текстовыми элементами, разрешение до 4K. Преемник популярной Nano Banana.

$0.134изображение
Изображения

Midjourney v8

Midjourney

Флагманская модель Midjourney для генерации изображений. V8 Alpha вышла 17 марта 2026 — полностью переписанный движок, генерация в 5 раз быстрее V7, нативное разрешение 2K без апскейла, значительно улучшенный рендеринг текста и точность следования промптам. Переход с TPU на GPU и PyTorch. Лучшая модель для художественной и коммерческой генерации изображений

$10/мес
Изображения

Nano Banana

Google

Image-модель Google из линейки Gemini 2.5 Flash — быстрая и точная генерация картинок по тексту. Известна под кодовым именем Nano Banana: задаёт новый стандарт качества в бюджетном сегменте за счёт отличного следования промпту, 2K-разрешения и редактирования на входе текст + картинка.

Бесплатно
Изображения

Ideogram 3.0

Ideogram

Генератор изображений с лучшим в индустрии рендерингом текста (90-95% точность). Style Reference для консистентного стиля, Magic Fill для редактирования. 25 бесплатных изображений в день.

Бесплатно
Изображения

Stable Diffusion 3.5

Stability AI

Семейство открытых моделей генерации изображений на MMDiT. Large (8.1B), Large Turbo (4 шага инференса) и Medium (2.5B, 9.9 ГБ VRAM). Типографика, сложные промпты. Бесплатно для коммерческого использования до $1M выручки.

$0.035/изображение

Используете DALL-E 3?

Поделитесь опытом в нашем сообществе

Написать пост