MAI-Image-2: генератор изображений от Microsoft

Команда суперискусственного интеллекта Microsoft, возглавляемая Мустафой Сулейманом, представила MAI-Image-2. Это AI-модель, которая превращает текстовые запросы (промпты) в изображения. На данный момент модель занимает третье место в рейтинге (лидерборде) Arena.ai среди генераторов text-to-image. Она заметно уступает GPT-Image-1.5 от OpenAI и Nano Banana 2 от Google.

По заявлению Microsoft, MAI-Image-2 особенно силён в фотореалистичных изображениях с естественным освещением и точной передачей оттенков кожи. Также модель хорошо справляется с детализированными сюрреалистичными сценами. Модель разрабатывалась при участии фотографов, дизайнеров и визуальных художников.

Три изображения, сгенерированные MAI-Image-2 рядом: портрет с игрой теней на лице, макросъёмка ириса и человек внутри синей ледниковой пещеры. Microsoft утверждает, что MAI-Image-2 генерирует фотореалистичные изображения с естественным освещением и высокой детализацией: портрет с игрой теней, макросъёмка ириса и сцена в ледниковой пещере. | Изображение: Microsoft

Модель справляется и с более прикладными задачами. Например, с надёжной отрисовкой (рендерингом) текста внутри изображений. Это полезно для создания постеров, инфографики и диаграмм.

Три постера, сгенерированных MAI-Image-2 рядом: постер модернизма с красным кругом, меню кафе с оранжевой иллюстрацией и постер конного мероприятия с прыгающей лошадью. По словам Microsoft, MAI-Image-2 корректно отображает текст в сгенерированных изображениях, что делает его полезным для постеров и типографических макетов. | Изображение: Microsoft

MAI-Image-2 доступен для тестирования в MAI Playground (зависит от региона). Модель будет постепенно появляться в Copilot и Bing Image Creator. Доступ через API пока ограничен избранными корпоративными клиентами. Вскоре он откроется всем разработчикам через Microsoft Foundry. Технические детали, ценообразование и информация об обучающих данных компания пока не раскрывает.

Первый собственный генератор изображений Microsoft — MAI-Image-1 — вышел в октябре 2025 года. Тогда он занял лишь девятое место на Arena.ai, особого впечатления не произведя. Прыжок MAI-Image-2 на третье место показывает заметный прогресс. Но до конкуренции с топ-моделями OpenAI и Google Microsoft ещё далеко — хотя компания, по слухам, намерена именно этого достичь.