Imagen 3
Флагманская модель генерации изображений от Google DeepMind, доступная через Vertex AI и Google AI Studio. Обеспечивает фотореалистичное качество и точное следование текстовым описаниям.
Тарифы
- Vertex AI: от $0.02 за изображение 1024×1024
- Ограниченно бесплатно в Google AI Studio
- Входит в Google One AI Premium ($19.99/мес) через Gemini Advanced
Плюсы и минусы
Плюсы
- Фотореалистичное качество изображений на уровне Midjourney и DALL-E 3
- Точное следование детальным текстовым описаниям
- Высокое качество рендеринга текста на изображениях
- Интеграция с экосистемой Google: Workspace, Vertex AI, Gemini
- Поддержка нескольких разрешений и соотношений сторон
Минусы
- Нет публичного бесплатного доступа — только через платные сервисы Google
- Ограниченный доступ для пользователей вне США на начальном этапе
- Строгие ограничения контента — не генерирует реалистичные лица известных людей
- Зависимость от инфраструктуры Google Cloud для API-интеграции
Подробный обзор
Imagen 3 — третье поколение системы генерации изображений от Google DeepMind, представленное в 2024 году. Модель значительно превосходит предыдущие версии по фотореалистичности, детализации и способности точно воспроизводить содержимое текстовых запросов, включая рендеринг текста прямо на изображениях.
Ключевым улучшением Imagen 3 стала способность понимать сложные многоуровневые промпты. Модель корректно обрабатывает пространственные отношения между объектами, сложное освещение, текстуры материалов и стилистические особенности. Особо выделяется качество рендеринга текста: в отличие от конкурентов, Imagen 3 генерирует читаемые надписи на изображениях.
Коммерческий доступ осуществляется через Google Vertex AI — корпоративную платформу машинного обучения. Стоимость начинается от $0.02 за изображение при разрешении 1024×1024 пикселей. Это делает Imagen 3 особенно привлекательной для бизнеса, уже использующего Google Cloud.
Для широкой аудитории Imagen 3 доступна через Gemini Advanced (входит в Google One AI Premium по $19.99/мес) и ImageFX — бесплатный экспериментальный инструмент Google. Модель интегрирована в Google Workspace: пользователи могут генерировать изображения прямо в Google Slides и Docs.
По оценкам независимых тестирований, Imagen 3 конкурентна с Midjourney v6 и DALL-E 3 в категории фотореалистичных изображений, превосходя их в точности воспроизведения текста и пространственных отношений. В художественных стилях несколько уступает Midjourney, который традиционно лидирует в этом сегменте.