Image-модель Google из линейки Gemini 2.5 Flash — быстрая и точная генерация картинок по тексту. Известна под кодовым именем Nano Banana: задаёт новый стандарт качества в бюджетном сегменте за счёт отличного следования промпту, 2K-разрешения и редактирования на входе текст + картинка.
—
Тарифы
Gemini Free
Бесплатно
Доступ через AI Studio с лимитами
Быстрые генерации
Ограниченное число запросов в день
Gemini API
$0.039изображение
Прямой API для разработчиков
Разрешение до 2K
Prompt + image input (редактирование)
Токенизация: 1290 output tokens на картинку
Плюсы и минусы
Плюсы
Лидер по точности промпта среди быстрых моделей
Отличная работа с текстом на картинке (лучше Midjourney и FLUX)
Поддержка редактирования: картинка + текст на вход, новая картинка на выход
Разрешение до 2048 px, подходит для соцсетей и превью
Низкая цена — $0.039 за изображение
Интегрирована в Gemini API — одна учётка для всего
Минусы
Недоступна в России без VPN и иностранной карты
Стилистически суше Midjourney — без киношной эстетики
Хуже детализирует сложные сцены чем Nano Banana Pro
Нет встроенных контролей в духе ControlNet
Не умеет в SVG и векторные форматы
Подробный обзор
gemini-2.5-flash-image
.
Вопросы и ответы
Что такое Nano Banana?+
Кодовое имя Gemini 2.5 Flash Image — image-модели Google, встроенной в Gemini API. Релиз — август 2025. Рассчитана на быструю массовую генерацию при хорошей точности промпта.
Чем Nano Banana отличается от Nano Banana Pro?+
Pro (Gemini 3 Pro Image) — премиум-версия: 2K/4K, лучше детализация и сложные сцены, $0.134 за картинку. Обычный Nano Banana быстрее и дешевле — $0.039, 2K.
Работает ли в России?+
Нет, Google не даёт прямой доступ к Gemini API из РФ — требуется VPN и иностранная карта для оплаты. Без VPN возможен только доступ через сторонние сервисы-прокси.
Можно ли использовать коммерчески?+
Да — Google разрешает коммерческое использование всех изображений, сгенерированных Gemini API. Все картинки содержат невидимый SynthID-вотермарк для идентификации ИИ.
Как рисовать текст на картинке?+
Nano Banana — одна из лучших моделей для текста. Пишите в промпте text reads "ваш текст". Она надёжно рендерит кириллицу и латиницу в 95% случаев без опечаток.
— кодовое имя image-модели Google, входящей в семейство Gemini 2.5. Публичное имя — Gemini 2.5 Flash Image. Релиз состоялся 26 августа 2025 года и за несколько месяцев модель стала одним из самых обсуждаемых image-генераторов — за счёт редкого для бюджетного сегмента сочетания скорости, точности следования промпту и качества работы с текстом на изображении.
Краткая справка
Разработчик:
Google DeepMind
Релиз:
26 августа 2025 года
API-идентификатор:
Разрешение:
до 2048×2048 пикселей
Цена:
$0.039 за 1 изображение (1290 output tokens)
Доступ:
GeminiAPI, AI Studio, Google AI Studio
В чём сильная сторона
Главный козырь —
следование промпту
. На A/B-тестах Nano Banana обгоняет Midjourney v7 и FLUX 1.1 Pro в задачах, где нужно точно воспроизвести описание: "женщина в красной куртке с жёлтым шарфом на фоне синего моря" — Midjourney может перекрасить детали ради эстетики, Nano Banana отрисует именно то, что попросили.
Второй козырь —
текст на изображениях
. Модель надёжно рендерит кириллицу и латиницу, ошибок в словах мало. Для баннеров соцсетей, обложек, мемов — одна из лучших.
Третий —
редактирование
: на вход можно отправить картинку и текстовую инструкцию ("поменяй фон на закат"), получить отредактированную версию. Это не Photoshop, но экономит кучу времени на черновой правке.
Сравнение с Nano Banana Pro
В ноябре 2025 вышла
Nano Banana Pro
— премиум-версия на базе Gemini 3 Pro Image. Она стоит в 3.5 раза дороже ($0.134 против $0.039), но лучше детализирует сложные сцены, поддерживает 4K и сильнее в текстовых элементах большого размера. Для обычных задач — соцсети, черновики, быстрая генерация — стандартный Nano Banana практически не уступает.
Доступ из России
Google не открыл GeminiAPI в РФ: требуется VPN и иностранная карта (или платёжная виртуалка). Прямая оплата российскими картами не принимается. Альтернативы без VPN в том же бюджетном сегменте —
YandexART 2
и
Stable Diffusion 3.5
Для каких задач подходит
Массовая генерация картинок для соцсетей и блогов
Баннеры, обложки, мемы с точным текстом
Черновики перед финальной работой в Midjourney или FLUX