Оглавление

Как сообщает The Decoder, китайский технологический гигант Alibaba выпустил флагманскую языковую модель Qwen3-Max — самую крупную и производительную в своей линейке. Новая модель с более чем триллионом параметров ориентирована на реальные задачи разработки программного обеспечения и автоматизации.

Рейтинг языковой модели Qwen3-Max на первом месте на текстовой арене лидеров

Технические характеристики и архитектура

Qwen3-Max была обучена на 36 триллионах токенов и использует архитектуру Mixture of Experts (MoE), что означает активацию только части параметров во время вывода. Это позволяет значительно экономить вычислительные ресурсы при сохранении высокой производительности.

Предварительная версия Qwen3-Max-Instruct, выпущенная ранее в этом месяце, уже заняла третье место на Text Arena Leaderboard, обойдя вариант GPT-5-Chat от OpenAI с пониженными настройками рассуждений.

Улучшения в обучении и эффективности

Команда разработчиков отмечает необычайную стабильность процесса обучения Qwen3-Max с плавной кривой потерь без внезапных скачков или откатов. Оптимизированная параллелизация сделала обучение Qwen3-Max-Base на 30% эффективнее по сравнению с Qwen2.5-Max-Base.

Для работы с длинным контекстом были применены новые техники, утроившие пропускную способность и позволившие обрабатывать последовательности длиной до миллиона токенов. Инструменты автоматического мониторинга и восстановления сократили простои из-за аппаратных сбоев до одной пятой от предыдущего поколения.

Производительность и бенчмарки

Qwen3-Max-Instruct демонстрирует лучшие результаты в широком спектре тестов, включая:

  • Знания и логические рассуждения
  • Программирование и следование инструкциям
  • Соответствие человеческим предпочтениям
  • Агентские задачи и многозадачность
  • Многоязычное понимание

Наиболее значительные улучшения наблюдаются в программировании и агентских способностях. На бенчмарке SWE-Bench Verified для исправления реальных программных ошибок модель показала результат 69.6 баллов, что ставит её в число лучших доступных моделей.

На Tau2-Bench, тестирующем способность моделей вызывать внешние инструменты и обрабатывать сложные рабочие процессы, Qwen3-Max-Instruct набрала 74.8 балла, опередив Claude 4 Opus и Deepseek V3.1.

Китайские ИИ-лаборатории явно наступают на пятки западным коллегам. Триллион параметров и третье место в рейтинге — это серьёзная заявка на конкуренцию с OpenAI и Anthropic. Особенно впечатляет специализация на разработке: пока все увлекаются генерацией картинок и видео, Alibaba целенаправленно улучшает то, что действительно приносит деньги — автоматизацию кодинга.

Будущие разработки и доступность

Версия Qwen3-Max-Thinking, ориентированная на рассуждения, всё ещё находится в стадии обучения, но уже показывает максимальные результаты на математических бенчмарках AIME 25 и HMMT, соответствуя результатам GPT-5 Pro и Grok 4. Модель использует интерпретатор кода и дополнительные вычисления во время тестирования.

Qwen3-Max-Instruct доступна на Qwen Chat, но, как и многие другие модели Qwen, не является открытой. Разработчики могут использовать API через Alibaba Cloud Model Studio, причём интерфейс совместим с OpenAI APIs.

Новая модель стала частью масштабного расширения ИИ-линейки Alibaba, которая недавно представила Qwen-3-TTS-Flash для генерации голоса, Qwen-Image-Edit для редактирования изображений, Qwen3-Next для ускоренной обработки текста и мультимодальную модель Qwen3-Omni.