Оглавление

Microsoft совершила стратегический рывок в гонке искусственного интеллекта, представив первые полноценные большие модели собственной разработки. Два новых продукта — речевая модель MAI-Voice-1 и текстовая MAI-1-preview — сигнализируют о растущем желании компании диверсифицировать зависимости от технологий OpenAI.

Технические характеристики новых моделей

MAI-Voice-1 позиционируется как одна из самых быстрых речевых систем на рынке. По заявлениям Microsoft, модель генерирует минуту аудио менее чем за секунду, используя всего один GPU. Это достигается за счёт оптимизированной архитектуры и эффективного использования вычислительных ресурсов.

Модель уже интегрирована в Copilot Daily и подкасты, а также доступна для тестирования в Copilot Labs.

MAI-1-preview — первый фундаментальный прорыв Microsoft

Второй анонс, MAI-1-preview, представляет особый интерес. Это первая фундаментальная модель Microsoft, обученная на примерно 15,000 NVIDIA H100 GPU. Для сравнения, конкуренты вроде xAI’s Grok использовали свыше 100,000 GPU.

Стратегия «эффективность вместо брутфорса» выглядит разумно, особенно учитывая текущие дефициты GPU на рынке. Но 13-е место в LMArena без подробных бенчмарков — это пока скорее красивый анонс, чем технологический прорыв. Напомню, что Microsoft уже несколько лет пытается создать конкурентоспособные модели, но до сих пор довольствовалась ролью инфраструктурного гиганта с чужими технологиями.

Мустафа Сулейман, глава Microsoft AI, подчеркивает, что успех моделей зависит не только от вычислительной мощности, но и от тщательного отбора данных и эффективного использования ресурсов. По его словам, критически важно избегать траты вычислительных мощностей на данные, которые не способствуют обучению модели.

MAI-1-preview уже доступна для публичного тестирования на платформе LMArena и постепенно интегрируется в функции Copilot. Разработчики могут подать заявку на доступ к API.

Стратегические последствия и отношения с OpenAI

Microsoft заявляет, что разработка собственных моделей является частью долгосрочной стратегии с пятилетним планом и продолжающимися инвестициями. Компания использует новые вычислительные кластеры на базе чипов Nvidia GB200 и планирует создавать специализированные модели для различных сценариев использования.

Особое внимание уделяется формированию поведения моделей после обучения. Microsoft работает над удалением черт, которые могут создавать иллюзию эмоций или намерений у ИИ.

При инвестициях до $13 миллиардов и множественных эксклюзивных соглашениях Microsoft остаётся крупнейшим инвестором OpenAI. Однако компании сейчас ведут сложные переговоры о реструктуризации OpenAI. Разработка собственных моделей может рассматриваться как сигнал к пересмотру отношений, хотя руководство Microsoft настаивает, что цель — укрепление партнёрства.

По материалам The Decoder