Оглавление

Компания Xiaomi представила новую флагманскую модель MiMo-V2.5-Pro, которая, судя по внутренним тестам, готова составить прямую конкуренцию признанному лидеру сегмента — Claude Opus. Как сообщает издание The Decoder, этот ИИ с открытыми весами ориентирован на длительную автономную работу и решение сложных инженерных задач, требующих тысяч последовательных вызовов инструментов.

Архитектура новинки базируется на принципе Mixture-of-Experts (MoE), где из общего объема в 1,02 триллиона параметров для каждого конкретного запроса активируются лишь 42 миллиарда. Такой подход позволяет сочетать колоссальный объем знаний с относительной эффективностью вычислений. Модель способна обрабатывать контекстное окно до одного миллиона токенов, что открывает двери для анализа огромных кодовых баз без потери нити рассуждений.

Производительность в реальных задачах

Способности MiMo-V2.5-Pro были продемонстрированы на примере создания полноценного компилятора — задачи, которая обычно занимает у студента профильного вуза несколько недель. ИИ справился за 4,3 часа, выполнив 672 обращения к инструментам и достигнув стопроцентного прохождения тестов. Примечательно, что в процессе модель столкнулась с регрессией в коде, которую самостоятельно диагностировала и устранила.

Помимо компилятора, Xiaomi показала автономную разработку видеоредактора для рабочего стола объемом около 8 000 строк кода. На эту задачу у модели ушло 11,5 часов непрерывной работы. Подобные показатели указывают на то, что фокус разработки сместился с простых текстовых ответов в сторону агентских систем, способных существовать в рабочем цикле часами без вмешательства человека.

Эффективность MiMo-V2.5-Pro подчеркивается низким потреблением ресурсов: по данным разработчиков, для достижения аналогичных результатов модели требуется на 40–60% меньше токенов, чем западным аналогам вроде Gemini 3.1 Pro или GPT-5.4. Это может стать решающим фактором для компаний, стремящихся оптимизировать операционные расходы на использование ИИ в производственных цепочках.

Открытые веса MiMo — сильный ход для захвата рынка, однако архитектурная сложность MoE-моделей такого масштаба делает их локальный запуск забавой для владельцев серверных стоек, а не обычных разработчиков. Xiaomi умело масштабирует объем, но вопрос стабильности логики при многочасовых сессиях остается открытым. Красивая витрина, за которой скрывается неизбежная хрупкость автономных агентов.

Расширение экосистемы и технические нюансы

Вместе с флагманом Xiaomi выпустила ряд специализированных решений. Модель MiMo-V2.5 с 310 миллиардами параметров позиционируется как мультимодальное решение, работающее с текстом, аудио и видео. Она уже доступна на платформе Hugging Face, что подтверждает стремление компании играть на поле Open Source, создавая массовый продукт для мирового сообщества исследователей.

Технический фундамент серии включает механизмы параллельного предсказания токенов, ускоряющие вывод в три раза, и комбинированную систему внимания (local and global attention). Это позволило сократить требования к памяти при работе с длинными текстами почти в семь раз. Обучение флагмана проходило на массиве из 27 триллионов токенов, что сопоставимо с крупнейшими проектами в индустрии.

Линейку дополняют системы распознавания речи (ASR) и синтеза голоса (TTS). Если модель MiMo-V2.5-ASR открыта для сообщества и демонстрирует отличные результаты в понимании китайских диалектов и смешанной речи, то продвинутый синтез голоса пока доступен только через API. Это разделение подчеркивает стратегию Xiaomi: отдавать базовые инструменты в общий доступ, сохраняя контроль над наиболее коммерчески перспективными сервисами.

Текущая гонка китайских разработчиков, в которую включились Xiaomi и DeepSeek, наглядно показывает, что лидерство теперь измеряется не только баллами в тестах. На первый план выходит стоимость владения и способность модели к длительной автономности. Похоже, эпоха коротких чатов подходит к концу, уступая место цифровым сотрудникам, которые работают, пока мы спим.