Изучаю и тестирую нейросети более 2 лет. Основатель Shtruzel — помогаю разобраться в мире ИИ простым языком.
Рейтинг Arena.ai
).
Комментарии (0)
Комментариев пока нет. Будьте первым!
Пример генерации
Пример генерации
Пример генерации
gpt-image-2
✅
Пример генерации
Пример генерации
1
2
3
4
5
gpt-image-2
.
.
Пока я читал пресс-кит от OpenAI,
Arena.ai
опубликовал пост в X: GPT-Image-2 занял первое место во всех категориях рейтинга Text-to-Image с рекордным отрывом
+242 балла
от ближайшего конкурента — Nano Banana 2. Счёт: 1512 против 1271. Это самый большой разрыв за всю историю платформы.
Модель вышла сегодня. Разбираю всё по порядку — только факты, только верифицированные источники.
Что такое ChatGPT Images 2.0
Это новый флагманский генератор изображений от OpenAI, работающий на модели
gpt-image-2
. Не обновление предыдущего — переосмысление того, как вообще должна работать генерация изображений.
Ключевая идея, которую OpenAI озвучила официально:
«Изображения — это язык, а не украшение. Хорошая картинка делает то же, что хорошее предложение — выбирает, расставляет, раскрывает»
(источник: VentureBeat).
Именно от этого тезиса строится вся логика модели. GPT-Image-2 — это не «улучшенный DALL-E». Это первый генератор изображений с reasoning-архитектурой, который думает перед тем, как рисовать.
Главное нововведение: Thinking Mode
Впервые в истории генератор изображений получил
режим рассуждений
— тот самый механизм из серии O, который стоит за GPT-4o. Перед созданием картинки модель:
Анализирует запрос
При необходимости
ищет в интернете
актуальную информацию
Генерирует несколько вариантов внутри
Сверяет результат с запросом
Выдаёт финальный вариант
В thinking mode можно получить
до 8 согласованных изображений из одного промпта
— с одним персонажем, стилем и окружением по всем кадрам. Персонажи, объекты, палитра остаются идентичными между сценами (источник:
The Decoder, 21 апреля 2026
Обратная сторона: скорость. Thinking mode работает медленнее обычного режима — иногда заметно. Для простых запросов это излишне. Для сложных — оправдано полностью.
Thinking mode — только для Plus, Pro, Business и Enterprise. Стандартный режим — для всех, включая бесплатных пользователей.
Текст внутри изображений: наконец решено
Это была главная нерешённая проблема всей индустрии AI-генерации на протяжении нескольких лет. Любая надпись на баннере, меню, постере, UI-элементе превращалась в нечитаемый набор символов.
GPT-Image-2 решает это архитектурно, а не «полировкой». Журналист TechCrunch попросил сгенерировать меню мексиканского ресторана. Получил файл, который можно сразу отдать в печать — без единого вмешательства в Photoshop (источник: TechCrunch, 21 апреля 2026).
OpenAI официально заявляет: модель теперь корректно рендерит:
Плотный текст в инфографике и научных диаграммах
Мелкие подписи и иконографику
UI-элементы и интерфейсы приложений
Текст в нелатинских алфавитах: японский, корейский, хинди, бенгали
VentureBeat протестировал карту территорий Ацтекской, Майянской и Инкской империй с расшифровкой — все надписи легендой читаемы и корректны. GPT-Image-2 и Nano Banana 2 справились. Нано Банана Про — нет (источник: VentureBeat, 21 апреля 2026).
Технические характеристики
Параметр
Значение
Модель в API
Разрешение
До 2K (4K в бета-режиме)
Соотношения сторон
от 3:1 (ультраширокое) до 1:3 (портретное)
Изображений из одного промпта
До 8 (thinking mode)
Веб-поиск при генерации
Дата знаний
Декабрь 2025
Предшественник
GPT-Image-1.5 (переведён в legacy)
API-цены
(официальные, источник: The Decoder):
Входящие токены изображений:
$8 / 1M
Кешированные входящие:
$2 / 1M
Исходящие токены изображений:
$30 / 1M
Текстовые токены (вход): $5 / 1M
Текстовые токены (выход): $10 / 1M
На практике: генерация 1024×1536 в высоком качестве через API —
$0.165
за изображение. Это дешевле, чем GPT-Image-1.5 при том же разрешении ($0.20).
Что умеет — реальные кейсы
Журналы и редакционные макеты.
OpenAI демонстрирует обложку журнала с читаемой типографикой, Volume number, датой и даже штрихкодом. Всё рендерится корректно.
Многостраничная манга.
Четыре страницы с одним персонажем, последовательным нарративом и сохранённым визуальным стилем — из одного промпта.
Маркетинговый пакет.
Один запрос — рекламные материалы в разных форматах и соотношениях сторон одновременно.
Карты и инфографика.
Исторические карты с расшифровкой, научные диаграммы, образовательные постеры.
Экспорт без фона — ранее у большинства генераторов работал ненадёжно.
Рейтинг
Arena.ai
: GPT-Image-2 занял первое место
Сразу после релиза
Arena.ai
опубликовал обновлённую таблицу Text-to-Image Leaderboard:
Место
Модель
Баллы
GPT Image 2 (Medium)
1 512
Nano Banana 2
1 271
Nano Banana Pro (2K)
1 244
GPT Image 1.5 (High)
1 241
Nano Banana Pro
1 232
Отрыв +242 балла от ближайшего конкурента — рекорд для всего рейтинга (источник:
Arena.ai
, 21 апреля 2026).
Доступность и цены
ChatGPT:
Free / Go
— стандартный режим, базовое качество
Plus ($20/мес)
— Thinking mode, продвинутые выходные данные
Pro ($200/мес)
— ImageGen Pro, максимальные лимиты
Business / Enterprise
— корпоративный доступ с управлением командой
API:
модель
доступна разработчикам прямо сейчас. Интеграция в Codex — без отдельного API-ключа.
Из России:
нужен VPN. Сервисы OpenAI в РФ без обхода блокировки не работают. Варианты доступа — в
гайде по оплате нейросетей из России
Сравнение с Nano Banana Pro
По данным
Arena.ai
на 21 апреля: GPT-Image-2 обогнал Nano Banana Pro (1232 балла) на 280 очков. Это большой разрыв.
Где Images 2.0 выигрывает: текст, UI, многокадровые последовательности, веб-поиск при генерации.
Где Нано Банана Про ещё держится: художественный стиль, фотореалистичные текстуры кожи и материалов, скорость без thinking mode.
Полный рейтинг генераторов изображений —
на Shtruzel
GPT-Image-1.5 переведён в legacy: остаётся доступен через API для обратной совместимости, но больше не является моделью по умолчанию. OpenAI уверена, что 2.0 — полноценная замена для всех сценариев.