Флагманская модель генерации изображений от Google DeepMind, доступная через Vertex AI и Google AI Studio. Обеспечивает фотореалистичное качество и точное следование текстовым описаниям.
—
Тарифы
API
$—
Vertex AI: от $0.02 за изображение 1024×1024
Бесплатно
Бесплатно
Ограниченно бесплатно в Google AI Studio
Платный
$—
Входит в Google One AI Premium ($19.99/мес) через Gemini Advanced
Плюсы и минусы
Плюсы
Фотореалистичное качество изображений на уровне Midjourney и DALL-E 3
Точное следование детальным текстовым описаниям
Высокое качество рендеринга текста на изображениях
Интеграция с экосистемой Google: Workspace, Vertex AI, Gemini
Поддержка нескольких разрешений и соотношений сторон
Минусы
Нет публичного бесплатного доступа — только через платные сервисы Google
Ограниченный доступ для пользователей вне США на начальном этапе
Строгие ограничения контента — не генерирует реалистичные лица известных людей
Зависимость от инфраструктуры Google Cloud для API-интеграции
Подробный обзор
Вопросы и ответы
Как получить доступ к Imagen 3?+
Есть несколько способов: через Google AI Studio (бесплатно, с лимитами), через Gemini Advanced в составе Google One AI Premium ($19.99/мес), через Vertex AI API для разработчиков (от $0.02 за изображение), а также в Google Workspace для корпоративных пользователей.
Поддерживает ли Imagen 3 русскоязычные промпты?+
Да, Imagen 3 понимает запросы на русском языке. Качество генерации по русским промптам хорошее, хотя для достижения наилучших результатов рекомендуется использовать детальные описания.
Чем Imagen 3 лучше DALL-E 3?+
Imagen 3 превосходит DALL-E 3 в рендеринге текста на изображениях, точности передачи пространственных отношений и реализме текстур. DALL-E 3 выигрывает за счёт интеграции с ChatGPT и более простого доступа.
Imagen 3 — третье поколение системы генерации изображений от Google DeepMind, представленное в 2024 году. Модель значительно превосходит предыдущие версии по фотореалистичности, детализации и способности точно воспроизводить содержимое текстовых запросов, включая рендеринг текста прямо на изображениях.
Ключевым улучшением Imagen 3 стала способность понимать сложные многоуровневые промпты. Модель корректно обрабатывает пространственные отношения между объектами, сложное освещение, текстуры материалов и стилистические особенности. Особо выделяется качество рендеринга текста: в отличие от конкурентов, Imagen 3 генерирует читаемые надписи на изображениях.
Коммерческий доступ осуществляется через Google Vertex AI — корпоративную платформу машинного обучения. Стоимость начинается от $0.02 за изображение при разрешении 1024×1024 пикселей. Это делает Imagen 3 особенно привлекательной для бизнеса, уже использующего Google Cloud.
Для широкой аудитории Imagen 3 доступна через Gemini Advanced (входит в Google One AI Premium по $19.99/мес) и ImageFX — бесплатный экспериментальный инструмент Google. Модель интегрирована в Google Workspace: пользователи могут генерировать изображения прямо в Google Slides и Docs.
По оценкам независимых тестирований, Imagen 3 конкурентна с Midjourney v6 и DALL-E 3 в категории фотореалистичных изображений, превосходя их в точности воспроизведения текста и пространственных отношений. В художественных стилях несколько уступает Midjourney, который традиционно лидирует в этом сегменте.