Штруцель
Сообщество
Статьи
Новости
Свежие релизы и обновления
Статьи
Аналитика и разборы
Гайды
Пошаговые инструкции
Обзоры
Сравнения и тесты
Туториалы
Практические уроки
Модели
Текстовые
GPT, Claude, Gemini и другие
Изображения
Midjourney, DALL-E, FLUX
Код
Copilot, Cursor, Windsurf
Видео
Sora, Runway, Kling
Музыка
Suno, Udio
Инструменты
Генератор промптов
Для ChatGPT, Claude, Midjourney
Переводчик ошибок
Объяснение на русском
Рерайтер текста
Перефразирование с ИИ
GPT-чат
Бесплатно, без VPN
Промпт-Баттл
Два ИИ спорят
SEO-аудит
Проверка сайта
Хабы
Claude Code
IDE-агент Anthropic
ChatGPT
OpenAI GPT-5
Midjourney
Генерация картинок
Cursor
AI-IDE
Gemini
Google AI
Все хабы
16 брендов ИИ
Рейтинги
Бесплатные
ИИ с бесплатным доступом
Бюджетные
Самые дешёвые по $/1M
Работают в РФ
Без VPN и иностранной карты
Для кода
По SWE-Bench и HumanEval
Для картинок
Midjourney, FLUX, DALL-E
Для видео
Sora, Veo, Kling, Runway
Для музыки
Suno, Udio, MusicGen
Для голоса
ElevenLabs, Whisper
Все рейтинги
15 подборок по задачам
Аналитика
Сравнение моделей
Бенчмарки, цены, вердикт
Хронология моделей
Таймлайн и граф релизов
Shtruzel
Сообщество
Новости
Статьи
Модели
Инструменты
Рейтинги
Аналитика
Сервисы
Хабы16
Claude CodeChatGPTCursorMidjourneyElevenLabsGeminiGitHub CopilotWindsurfPerplexityGrokYandexGPTGigaChatStable DiffusionFLUXDeepSeekKling
Тёмная тема
ShtruzelShtruzel

Каталог, рейтинги и обзоры нейросетей. Бенчмарки, цены, возможности 70+ AI-моделей.

info@shtruzel.ruTelegram-канал

Каталог

  • Для текста
  • Для картинок
  • Для видео
  • Для музыки
  • Для голоса
  • Для кода
  • Все модели
  • Хабы брендов

Рейтинги

  • Бесплатные
  • Самые дешёвые
  • Работают в РФ
  • Для программистов
  • Для рассуждений
  • Длинный контекст
  • Все рейтинги →

Контент

  • Статьи и гайды
  • Сообщество
  • Сравнения моделей
  • Хронология моделей
  • Словарь ИИ
  • Инструменты
  • GPT-чат

О проекте

  • О проекте
  • Редакция
  • Правила сайта
  • Политика конфиденциальности
  • Cookies

© 2026 Shtruzel — Все права защищены

Сделано с ♥ для всех, кто интересуется ИИ

Защита от ботов — SmartCaptcha от Yandex Cloud

ГлавнаяСообщество
Все статьи
Статья

ChatGPT для фото и картинок в 2026: генерация, анализ, редактирование

19 апр 2026·5 мин чтения· 44
Шамиль
ШамильАвтор и главный редактор

Изучаю и тестирую нейросети более 2 лет. Основатель Shtruzel — помогаю разобраться в мире ИИ простым языком.

Генерация изображений в ChatGPT
Генерация изображений в ChatGPT

Комментарии (0)

Комментариев пока нет. Будьте первым!

Всё это работает внутри одного чата — прикрепляете изображение через скрепку или просите «нарисуй» прямо в сообщении, ChatGPT сам выбирает режим.

Генерация картинок: текущая модель и что на подходе

На 19 апреля 2026 в ChatGPT работает GPT Image 1.5 — нативная модель OpenAI (запущена в декабре 2025). Это не DALL-E и не отдельное приложение — модель встроена прямо в GPT-5.2, поэтому понимает контекст диалога и может дорабатывать картинку по вашим правкам.

Ключевые сильные стороны:

  • Генерация в 4 раза быстрее предыдущей модели
  • Точный рендер сложных композиций — до 15–20 объектов в кадре
  • Хорошо читаемый текст на изображениях (подписи, вывески, UI-макеты) — хотя ещё не идеально
  • Консистентность лиц между правками: сгенерировали персонажа → меняете одежду → лицо остаётся тем же

Про GPT Image 2, которую сейчас все ждут: OpenAI с 11 апреля A/B-тестирует её в ChatGPT под видом обычной 1.5. На LM Arena 4 апреля засветились три анонимных модели (maskingtape, gaffertape, packingtape) — тестеры отмечают 99%+ точности рендера текста и фотореализм, неотличимый от скриншотов. Официального релиза пока нет. Полный разбор — в отдельной статье про GPT Image 2. Ждём релиз до 12 мая 2026 — в эту дату закрываются DALL-E 2 и 3, и OpenAI нужна замена.

Промпт для ChatGPT (Генерация изображения)
Промпт для ChatGPT (Генерация изображения)
Результат генерации изображения по промпту выше - ChatGPT
Результат генерации изображения по промпту выше - ChatGPT

Анализ фото: что умеет Vision

Прикрепляете фото → спрашиваете. GPT-5.2 Vision читает содержимое, расшифровывает текст, разбирает диаграммы, считает объекты. Что реально работает:

  • Расшифровать чек или рецепт — вбиваю фото чека из Пятёрочки, получаю разобранный JSON с позициями и ценами
  • Объяснить ошибку на скрине — скриншот красной консоли → причина и фикс. Проще, чем копировать текст
  • Перевести меню или табличку с фото — с китайского, арабского, чего угодно
  • Распознать растение, насекомое, породу собаки
  • Разобрать математическую задачу с листа — включая рукопись
  • Проанализировать диаграмму/график — извлечь цифры, сравнить, сделать выводы

Чего НЕ умеет — идентифицировать конкретных людей (не по имени, не по лицу), это ограничение OpenAI на уровне политики.

Редактирование картинок

Загружаете своё фото → говорите что изменить. GPT Image 1.5 — самый сильный в этой задаче среди всего, что сейчас есть (на LM Arena в категории single-image-edit chatgpt-image-latest-high-fidelity на первом месте).

Что можно:

  • Примерка одежды: загружаете своё фото → «надень на меня белую рубашку и тёмные джинсы»
  • Смена причёски или цвета волос
  • Замена фона при сохранении персонажа
  • Стилизация: «сделай в стиле акварели / пиксель-арта / ретро-фото 70-х»
  • Убрать лишнее: «убери человека справа», «сотри водяной знак» (тут осторожно, работает не всегда)
  • Добавить объект: «положи кружку на стол рядом с ноутбуком»

Главное преимущество перед Midjourney и Stable Diffusion — сохраняется лицо и общая композиция. Модель меняет только то, что вы попросили.

Лимиты на разных тарифах

ТарифГенерация в деньАнализ фотоРедактирование
Free3–5 (плавающий лимит)есть, с лимитаминет
Plus (€23)до 40 в деньбезлимитесть
Business (€21/юзер)до 80 в деньбезлимитесть
Pro 5x (€103)200+

Бесплатные пользователи иногда попадают в A/B-тест GPT Image 2 — если картинка вдруг получилась невероятно чёткой с идеальным текстом, то вам повезло. Но лимиты на Free очень строгие: 3–5 картинок в день с откатом до обычных через пару часов.

Про оплату Plus из России — подробно в отдельном гайде. Если нужно без карты и VPN — есть бесплатный GPT-чат на Shtruzel, правда картинки там не генерит.

ChatGPT vs Midjourney vs Nano Banana 2

Честно по состоянию на апрель 2026:

ЗадачаЛучший
Text-to-image в целомGoogle Nano Banana 2 (№1 на LM Arena)
Редактирование существующих фотоChatGPT (GPT Image 1.5)
Рендер текста на картинкеGPT Image 1.5, после релиза — GPT Image 2
Художественная стилистикаMidjourney v7
Фотореализмблизко у всех трёх, Midjourney чуть впереди

Вывод: если задача — «подправить моё фото», брать ChatGPT. Если «создать арт с нуля с уникальной эстетикой» — Midjourney. Если нужно «дёшево и качественно массово» — Nano Banana 2 через Gemini. Подборку моделей сравнил в рейтинге нейросетей для картинок.

Рабочие промпты для ChatGPT

Вот что у меня реально даёт хороший результат:

Для генерации с нуля:

«Фото-реалистичный снимок [объект], снято на Canon R5, объектив 50mm f/1.4, естественное освещение, фон — [контекст], высокая детализация кожи/фактуры»

Для рендера текста:

«Плакат в стиле [стиль], крупный текст [текст в кавычках] в верхней трети, шрифт sans-serif, высокая читаемость»

Для редактирования:

«На этом фото: [что на фото]. Измени только [конкретное], остальное — сохрани как есть (лицо, освещение, поза). Новый вариант в том же стиле»

Трюк, который не все знают: ChatGPT в том же диалоге помнит предыдущие картинки. Сгенерировали персонажа → через 5 сообщений «нарисуй его же, но в космосе» → модель подхватит его лицо и одежду.

FAQ

В каком формате ChatGPT выдаёт картинки? PNG, разрешение до 2048×2048. Скачивание — правый клик → Сохранить как.

Можно ли генерить людей по фото-референсу? Нет. OpenAI не разрешает генерировать узнаваемых реальных людей по их фото. Работает только со своим лицом (с загруженным селфи).

Где посмотреть, какая у меня лимит осталась? Прямой счётчик OpenAI не показывает. Если лимит достигнут — пишет You've reached your image generation limit, приходится ждать несколько часов.

Почему у меня текст на картинке всё равно кривой? Вы ещё на GPT Image 1.5, а не на превью 2. Промпт «render text exactly as: [text]» с явным указанием в кавычках поднимает точность.

Работает ли генерация в мобильном приложении? Да, функционал идентичный. Если ещё не скачали — гайд по установке ChatGPT на телефон в России.

DALL-E ещё доступен? До 12 мая 2026. После этой даты — только GPT Image. В API dall-e-2 и dall-e-3 будут возвращать ошибку, нужно перейти на gpt-image-1.5 или грядущий gpt-image-2.

Картинки с ChatGPT можно использовать коммерчески? Да, OpenAI даёт полные коммерческие права на сгенерированные изображения. Но осторожнее со стилями живых художников и узнаваемыми брендами — можно попасть на претензии.

Сколько стоит API-вызов для картинки? GPT Image 1.5 — $0.04–0.19 в зависимости от качества и размера. GPT Image 2 ожидается по $0.15–0.20 за картинку.

Присоединяйся к сообществу

Делись мыслями, обсуждай новости ИИ, подписывайся на авторов.

Перейти в ленту

Смотрите также

Нейросеть для фото в 2026: генерация, обработка и оживление — полный разбор

DALL-E 3 выключен 12 мая, Sora закрылась 26 апреля. Актуальный расклад: GPT Image 2, Nano Banana Pro (2 фото/день free), FLUX.2, Midjourney V8.1. Kandinsky 6.0 и Шедеврум — бесплатно из России без VPN. Kling 3.0 — 66 кредитов в день для оживления фото

28 мая 2026·7 мин чтения· 33

Gemini Image API продолжает падать: разбор 503 ошибок и рабочие решения

45% отказов в пиковые часы, многодневный аутаж в феврале, два открытых бага в GitHub с priority/p1. Разбираем почему Gemini 3 Pro Image API нестабилен, что такое 503 и как защитить приложение с помощью retry логики и fallback моделей.

22 мая 2026·3 мин чтения· 69

Cursor Composer 2.5: что нового, бенчмарки, цены и баг 21 мая

18 мая Cursor выпустил Composer 2.5 — собственную модель на базе Kimi K2.5 с 25x больше синтетических задач. 79.8% на SWE-Bench Multilingual, в 10 раз дешевле Opus 4.7. Через 3 дня словили деградацию — разбираем релиз и инцидент.

22 мая 2026·3 мин чтения· 82
ChatGPT работает с картинками в трёх режимах:
генерирует новые изображения
(модель GPT Image 1.5),
анализирует загруженные фото
(GPT-5.2 с Vision) и
редактирует картинки по промпту
— меняет одежду, фон, стиль без потери лица и композиции. Разберу каждый режим на реальных примерах, сравню с Midjourney и Nano Banana 2, и скажу честно про GPT Image 2 — которую все ждут к концу апреля, но пока её нет в релизе. Плюс лимиты на разных тарифах и промпты, которые у меня реально работают.
Что умеет ChatGPT с картинками — три режима
Режим
Модель
Что делает
Генерация
GPT Image 1.5
Создаёт картинки по текстовому промпту
Анализ (Vision)
GPT-5.2
Читает и объясняет содержимое фото, документов, скринов
Редактирование
GPT Image 1.5
Меняет загруженную картинку по инструкции
безлимит
есть, приоритет
Pro 20x (€229)
800+
безлимит
есть, приоритет