Флагманская модель OpenAI для генерации изображений внутри ChatGPT. Умеет искать в интернете перед созданием картинки, генерировать несколько вариантов из одного промпта и проверять результат. Разрешение до 2K, корректный рендеринг текста внутри изображений, поддержка нескольких соотношений сторон. Подходит для маркетинговых материалов, журнальных макетов и многопанельных комиксов
—
Тарифы
Plus
$20/мес
Доступ к ChatGPT Images 2.0 с лимитом генераций
Pro
$200/мес
Расширенный лимит генераций, приоритетный доступ
Плюсы и минусы
Плюсы
Лучший рендеринг текста внутри изображений
Разрешение до 2K, несколько соотношений сторон
Thinking capabilities — ищет в интернете перед генерацией
Два года назад попросить любой AI-генератор сделать меню мексиканского ресторана означало получить блюда с названиями «энчуита», «бурто» и «маргатас». Сегодня ChatGPT Images 2.0 делает то же меню так, что его можно напечатать и повесить в заведении без единой правки. Это не метафора — именно такой тест провёл журналист TechCrunch сразу после релиза (источник:
TechCrunch, 21 апреля 2026
Главное: текст внутри изображений — наконец решено
Это была главная боль всей индустрии AI-генерации годами. Любая надпись на баннере, вывеска, этикетка — всё превращалось в нечитаемую кашу. GPT-Image-1.5 делал это лучше предшественников, но проблема оставалась.
Images 2.0 решает её архитектурно. По данным VentureBeat, модель получила
«O-series» reasoning capabilities
— те же механизмы рассуждений, что стоят за GPT-4o. Перед генерацией она анализирует запрос, ищет информацию в интернете при необходимости, проверяет собственный результат.
На практике это значит: карты с читаемыми легендами, UI-макеты с точными подписями, японский и корейский текст без артефактов, четырёхстраничная манга из одного промпта (источник:
Engadget, 21 апреля 2026
Thinking mode: модель, которая думает перед рисованием
Впервые в истории OpenAI выпустила генератор изображений с режимом рассуждений. Он работает так:
Получает запрос
Ищет актуальную информацию в интернете (если нужно)
Генерирует несколько вариантов внутри
Проверяет соответствие результата запросу
Отдаёт финальный вариант
Это медленнее обычного режима, но значительно точнее при сложных запросах. Thinking mode доступен только платным подписчикам (Plus и Pro). Бесплатные пользователи получают стандартный режим без рассуждений (источник:
Axios, 21 апреля 2026
Технические характеристики
Параметр
Значение
Максимальное разрешение
Соотношения сторон
Несколько вариантов
Дата знаний
Декабрь 2025
Web-поиск при генерации
✅ (в thinking mode)
API
✅ доступен, цена зависит от качества и разрешения
Что умеет — конкретно
Инфографика и презентации.
Карты исторических империй с читаемой легендой, слайды с текстом, схемы. По словам VentureBeat, это первый генератор (наравне с Nano Banana 2), справившийся с картой Ацтекской, Майянской и Инкской империй с расшифровкой.
Журналы и многостраничные макеты.
OpenAI прямо заявляет: можно создавать полноценные журналы. Маркетинговые материалы в разных форматах из одного промпта.
Многопанельные комиксы и манга.
Четыре страницы с одним персонажем из одного запроса. Пока с оговорками — в тесте Engadget кот между первой и последней страницей немного изменился.
Экспорт без фона — раньше у большинства генераторов это работало криво.
Сравнение с конкурентами
Images 2.0 выходит в момент, когда у него есть серьёзный конкурент —
Nano Banana 2
от Google (февраль 2026). Оба умеют рендерить плотный текст. По первым тестам VentureBeat, Images 2.0 превосходит Google в генерации UI и пакетной работе с несколькими изображениями. Midjourney сохраняет преимущество в художественном стиле и эстетическом контроле.
Сравнение всех генераторов изображений —
в рейтинге на Shtruzel
Доступность
Free и Go
— стандартный режим без thinking mode
Plus ($20/мес)
— thinking mode, более высокое качество
Pro ($200/мес)
— максимальные лимиты
API
— доступен разработчикам, цена зависит от разрешения (официально не объявлена)
Из России
— нужен VPN
GPT-Image-1.5 переходит в legacy-режим, но остаётся доступен через API.