— меняет одежду, фон, стиль без потери лица и композиции. Разберу каждый режим на реальных примерах, сравню с Midjourney и Nano Banana 2, и скажу честно про GPT Image 2 — которую все ждут к концу апреля, но пока её нет в релизе. Плюс лимиты на разных тарифах и промпты, которые у меня реально работают.
Что умеет ChatGPT с картинками — три режима
Режим
Модель
Что делает
Генерация
GPT Image 1.5
Создаёт картинки по текстовому промпту
Анализ (Vision)
GPT-5.2
Читает и объясняет содержимое фото, документов, скринов
Редактирование
GPT Image 1.5
Меняет загруженную картинку по инструкции
Всё это работает внутри одного чата — прикрепляете изображение через скрепку или просите «нарисуй» прямо в сообщении, ChatGPT сам выбирает режим.
Генерация картинок: текущая модель и что на подходе
На 19 апреля 2026 в ChatGPT работает
GPT Image 1.5
— нативная модельOpenAI (запущена в декабре 2025). Это не DALL-E и не отдельное приложение — модель встроена прямо в GPT-5.2, поэтому понимает контекст диалога и может дорабатывать картинку по вашим правкам.
Ключевые сильные стороны:
Генерация в 4 раза быстрее предыдущей модели
Точный рендер сложных композиций — до 15–20 объектов в кадре
Хорошо читаемый текст на изображениях (подписи, вывески, UI-макеты) — хотя ещё не идеально
Консистентность лиц между правками: сгенерировали персонажа → меняете одежду → лицо остаётся тем же
Про GPT Image 2
, которую сейчас все ждут: OpenAI с 11 апреля A/B-тестирует её в ChatGPT под видом обычной 1.5. На LM Arena 4 апреля засветились три анонимных модели (maskingtape, gaffertape, packingtape) — тестеры отмечают
99%+ точности рендера текста
и фотореализм, неотличимый от скриншотов. Официального релиза пока нет. Полный разбор — в
отдельной статье про GPT Image 2
. Ждём релиз до
12 мая 2026
— в эту дату закрываются DALL-E 2 и 3, и OpenAI нужна замена.
Анализ фото: что умеет Vision
Прикрепляете фото → спрашиваете. GPT-5.2 Vision читает содержимое, расшифровывает текст, разбирает диаграммы, считает объекты. Что реально работает:
Расшифровать чек или рецепт
— вбиваю фото чека из Пятёрочки, получаю разобранный JSON с позициями и ценами
Объяснить ошибку на скрине
— скриншот красной консоли → причина и фикс. Проще, чем копировать текст
Перевести меню или табличку с фото
— с китайского, арабского, чего угодно
Распознать растение, насекомое, породу собаки
Разобрать математическую задачу с листа
— включая рукопись
Проанализировать диаграмму/график
— извлечь цифры, сравнить, сделать выводы
Чего НЕ умеет — идентифицировать конкретных людей (не по имени, не по лицу), это ограничение OpenAI на уровне политики.
Редактирование картинок
Загружаете своё фото → говорите что изменить. GPT Image 1.5 — самый сильный в этой задаче среди всего, что сейчас есть (на LM Arena в категории single-image-edit
на первом месте).
Что можно:
Примерка одежды: загружаете своё фото → «надень на меня белую рубашку и тёмные джинсы»
Смена причёски или цвета волос
Замена фона при сохранении персонажа
Стилизация: «сделай в стиле акварели / пиксель-арта / ретро-фото 70-х»
Убрать лишнее: «убери человека справа», «сотри водяной знак» (тут осторожно, работает не всегда)
Добавить объект: «положи кружку на стол рядом с ноутбуком»
Главное преимущество перед Midjourney и Stable Diffusion —
сохраняется лицо и общая композиция
. Модель меняет только то, что вы попросили.
Лимиты на разных тарифах
Тариф
Генерация в день
Анализ фото
Редактирование
Free
3–5 (плавающий лимит)
есть, с лимитами
нет
Plus (€23)
до 40 в день
безлимит
есть
Business (€21/юзер)
до 80 в день
безлимит
есть
Pro 5x (€103)
200+
Бесплатные пользователи иногда попадают в A/B-тест GPT Image 2 — если картинка вдруг получилась невероятно чёткой с идеальным текстом, то вам повезло. Но лимиты на Free очень строгие: 3–5 картинок в день с откатом до обычных через пару часов.
Про
оплату Plus из России
— подробно в отдельном гайде. Если нужно без карты и VPN — есть
бесплатный GPT-чат на Shtruzel
, правда картинки там не генерит.
ChatGPT vs Midjourney vs Nano Banana 2
Честно по состоянию на апрель 2026:
Задача
Лучший
Text-to-image в целом
Google Nano Banana 2 (№1 на LM Arena)
Редактирование существующих фото
ChatGPT (GPT Image 1.5)
Рендер текста на картинке
GPT Image 1.5, после релиза — GPT Image 2
Художественная стилистика
Midjourney v7
Фотореализм
близко у всех трёх, Midjourney чуть впереди
Вывод:
если задача — «подправить моё фото», брать ChatGPT. Если «создать арт с нуля с уникальной эстетикой» — Midjourney. Если нужно «дёшево и качественно массово» — Nano Banana 2 через Gemini. Подборку моделей сравнил в
рейтинге нейросетей для картинок
Рабочие промпты для ChatGPT
Вот что у меня реально даёт хороший результат:
Для генерации с нуля:
«Фото-реалистичный снимок [объект], снято на Canon R5, объектив 50mm f/1.4, естественное освещение, фон — [контекст], высокая детализация кожи/фактуры»
Для рендера текста:
«Плакат в стиле [стиль], крупный текст [текст в кавычках] в верхней трети, шрифт sans-serif, высокая читаемость»
Для редактирования:
«На этом фото: [что на фото]. Измени только [конкретное], остальное — сохрани как есть (лицо, освещение, поза). Новый вариант в том же стиле»
Трюк, который не все знают: ChatGPT в том же диалоге помнит предыдущие картинки. Сгенерировали персонажа → через 5 сообщений «нарисуй его же, но в космосе» → модель подхватит его лицо и одежду.
FAQ
В каком формате ChatGPT выдаёт картинки?
PNG, разрешение до 2048×2048. Скачивание — правый клик → Сохранить как.
Можно ли генерить людей по фото-референсу?
Нет. OpenAI не разрешает генерировать узнаваемых реальных людей по их фото. Работает только со своим лицом (с загруженным селфи).
Где посмотреть, какая у меня лимит осталась?
Прямой счётчик OpenAI не показывает. Если лимит достигнут — пишет
, приходится ждать несколько часов.
Почему у меня текст на картинке всё равно кривой?
Вы ещё на GPT Image 1.5, а не на превью 2. Промпт «render text exactly as: [text]» с явным указанием в кавычках поднимает точность.
Работает ли генерация в мобильном приложении?
Да, функционал идентичный. Если ещё не скачали —
гайд по установке ChatGPT на телефон в России
DALL-E ещё доступен?
До 12 мая 2026. После этой даты — только GPT Image. В API
и
будут возвращать ошибку, нужно перейти на
или грядущий
Картинки с ChatGPT можно использовать коммерчески?
Да, OpenAI даёт полные коммерческие права на сгенерированные изображения. Но осторожнее со стилями живых художников и узнаваемыми брендами — можно попасть на претензии.
Сколько стоит API-вызов для картинки?
GPT Image 1.5 — $0.04–0.19 в зависимости от качества и размера. GPT Image 2 ожидается по $0.15–0.20 за картинку.