MAI-Image-1: новая модель генерации изображений от Microsoft

Microsoft представила MAI-Image-1 — первую собственную модель генерации изображений, занявшую 9-е место в рейтинге LMArena и конкурирующую с решениями Google и OpenAI.

Оглавление

Технические особенности и преимущества
Конкурентная среда
Стратегический контекст
Тестирование в реальных условиях

Microsoft представила MAI-Image-1 — первую модель генерации изображений, разработанную полностью собственными силами. Новая модель заняла девятое место в рейтинге LMArena, платформы для сравнительного тестирования ИИ-систем.

Технические особенности и преимущества

Компания заявляет, что при разработке MAI-Image-1 особое внимание уделялось избеганию повторяющихся и излишне стилизованных результатов. «Мы сосредоточились на тщательном отборе данных и нюансированной оценке, ориентированной на задачи, максимально приближенные к реальным творческим сценариям», — пояснили в Microsoft.

Ключевые характеристики модели:

Особенно эффективна в генерации пейзажей и фотореалистичных изображений
Точная работа со светом, тенями и отражениями
Оптимизированная производительность по сравнению с более крупными моделями

Конкурентная среда

В рейтинге LMArena MAI-Image-1 набрала 1096 баллов, уступив моделям конкурентов:

Gemini-2.5-Flash (Google) — 1154 балла (2 место)
GPT-Image-1 (OpenAI) — 1123 балла (7 место)
Hunyuan-image-3.0 — лидер рейтинга

Примечательно, что китайская модель Hunyuan-image-3.0 от Tencent в настоящее время возглавляет рейтинг, опережая всех западных конкурентов.

Стратегический контекст

MAI-Image-1 — не единственная собственная разработка Microsoft. Компания также создала MAI-Voice-1 для генерации естественной речи и серию языковых моделей Phi, специализирующихся на эффективном выполнении логических задач.

Это происходит на фоне продолжающейся поддержки Microsoft разработок OpenAI, включая финансовые инвестиции и предоставление инфраструктуры.

Интересно наблюдать, как Microsoft, будучи крупнейшим инвестором OpenAI, параллельно развивает собственные компетенции в генерации изображений. Похоже на стратегию «не класть все яйца в одну корзину» — компания хочет иметь альтернативу на случай, если партнерство с OpenAI по каким-то причинам станет менее выгодным. При этом девятое место в рейтинге — неплохой старт для первой полностью собственной модели, особенно учитывая жесткую конкуренцию со стороны Google и китайских разработчиков.

Тестирование в реальных условиях

В ходе тестирования на LMArena модели сравнивали по способности обрабатывать сложные световые условия. Пользователям предлагалось оценить генерацию сцены с двумя людьми в кафе у окна в поздний послеобеденный час — задача, требующая точной передачи смешанного освещения, отражений и реалистичности теней.

Модель скоро станет доступна в Copilot и Bing Image Creator, а пока все желающие могут протестировать ее на LMArena.

По материалам Analytics India Magazine

Новости

Microsoft выпускает собственную модель генерации изображений MAI-Image-1

Технические особенности и преимущества

Конкурентная среда

Стратегический контекст

Тестирование в реальных условиях

Еще интереснее

Сеть книжных магазинов Waterstones готова продавать написанные ИИ произведения, но с маркировкой

Runway выпустила Gen-4.5 — модель генерации видео нового уровня

Новая модель генерации изображений GPT Image2 доступна на платформе iMini AI

Suno будет сотрудничать с Warner Music ради легализации ИИ-музыки

Оставить комментарий