🎨 Изображения🧠 Мультимодальная API

MAI-Image-2

MicrosoftДата выхода: 2 апр 2026Контекст: 32K tokens Сайт

Модель генерации изображений Microsoft. Топ-3 на Arena.ai. До 1024x1024, промпт до 32K токенов. В 2 раза быстрее MAI-Image-1. 10-50 млрд параметров. Интеграция в Bing, PowerPoint и Copilot. Дешевле DALL-E 3.

—

Тарифы

Pay-per-use

$5/1M input tokens

$33/1M output
До 1024x1024
Foundry API

Плюсы и минусы

Плюсы

Топ-3 на Arena.ai
В 2 раза быстрее MAI-Image-1
Дешевле DALL-E 3
Интеграция с Bing, PowerPoint, Copilot

Минусы

Максимум 1024x1024
Закрытый код
Playground только из США
Нет видеогенерации

Подробный обзор

Вопросы и ответы

Лучше DALL-E 3?+

Дешевле, быстрее в 2 раза, топ-3 на Arena.ai.

Разрешение?+

До 1024x1024 пикселей.

Стоимость?+

$5/1М input + $33/1М output токенов.

Где использовать?+

Foundry API, Bing, PowerPoint, Copilot.

Похожие модели

Мультимодальная

Muse Spark

ChatGPT Images 2.0

OpenAI

Флагманская модель OpenAI для генерации изображений внутри ChatGPT. Умеет искать в интернете перед созданием картинки, генерировать несколько вариантов из одного промпта и проверять результат. Разрешение до 2K, корректный рендеринг текста внутри изображений, поддержка нескольких соотношений сторон. Подходит для маркетинговых материалов, журнальных макетов и многопанельных комиксов

$20/мес

Мультимодальная

Llama 3.1 405B

Llama 4 Maverick

GPT-5.5

OpenAI

Флагман OpenAI от 23.04.2026. GPT-5.5 задаёт SOTA на 14 публичных бенчмарках, обходит Claude Opus 4.7 и Gemini 3.1 Pro. Та же скорость, что у GPT-5.4, но на ~40% меньше токенов на задачу. Особенно силён в агентском коде (Terminal-Bench 2.0 — 82,7%), управлении ОС (OSWorld-Verified — 78,7%), GDPval (84,9%) и FrontierMath. Цена API вдвое выше предшественника. Доступен в ChatGPT и Codex для Plus, Pro, Business, Enterprise. Лидер в Artificial Analysis Intelligence Index (60)

Бесплатно

Используете MAI-Image-2?

Поделитесь опытом в нашем сообществе

Написать пост