Qwen

Qwen — семейство LLM и мультимодальных моделей Alibaba Cloud с доступом через Model Studio и OpenAI-совместимый API. Линейка включает коммерческие модели (Qwen-Max, Qwen-Plus, Qwen-Flash), специализированные модели для кода и зрения (Qwen-Coder, Qwen-VL), а также открытые Qwen2.5/Qwen3.

Модели (API)

ID (для API)	Тип / режим	Контекст	Кратко	Поддержка / ограничения	Цены ($/1M)	Документация
qwen-max	Универсальная (текст)	32,768; max out 8,192	Флагман среди текстовых Qwen.	OpenAI-совместимый интерфейс Deep thinking: нет	in (hit): не указано; in (miss): $1.6; out: $6.4	документация
qwen-plus	Универсальная (thinking / non-thinking)	до 1,000,000 (по версии)	Баланс качества/стоимости; режимы thinking/non-thinking.	OpenAI-совместимый интерфейс Thinking — отдельная тарификация	in (hit): не указано; in (miss): $0.115; out: $0.287	документация
qwen-flash	Универсальная (экономичная)	до 1,000,000	Модель с пониженной ценой/латентностью.	OpenAI-совместимый интерфейс Тариф зависит от длины контекста	in (hit): не указано; in (miss): $0.05–0.25; out: $0.40–2.00	документация
qwen3-coder-plus	Код (Reasoning/Tool-Use)	до 1,000,000	Коммерческая код-модель серии Qwen3-Coder.	OpenAI-совместимый интерфейс Тариф по диапазонам токенов	in (hit): не указано; in (miss): $1.00–6.00; out: $5.00–60.00	документация
qwen3-coder-flash	Код (экономичная)	до 1,000,000	Ускоренная/дешёвая код-модель.	OpenAI-совместимый интерфейс Тариф по диапазонам токенов	in (hit): не указано; in (miss): $0.05–0.25; out: $0.40–2.00	документация
qwen-vl-max	Мультимодальная (vision)	131,072; max out 8,192	Визуальное понимание/рассуждение; до 16,384 токенов на изображение.	Оплата за текстовые и «image tokens» OpenAI-совместимый интерфейс	in (hit): не указано; in (miss): $0.8; out: $3.2	документация
qwen-vl-plus	Мультимодальная (vision, экономичная)	131,072; max out 8,192	Баланс цены и качества в Qwen-VL.	Оплата за текстовые и «image tokens» OpenAI-совместимый интерфейс	in (hit): не указано; in (miss): $0.21; out: $0.63	документация

Ключевые особенности

OpenAI-совместимый интерфейс (Chat/Completions) в Model Studio
Режимы thinking/non-thinking у отдельных моделей (например, Qwen-Plus)
Контексты до 1M токенов у моделей Flash/Coder
Отдельные мультимодальные модели: Qwen-VL (vision), QVQ (visual reasoning)
Официальная страница «Models & Pricing» с тарифами в USD
Статус-страница Alibaba Cloud

Ограничения и риски

Qwen-Max: «deep thinking» не поддерживается
API не хранит историю диалога; контекст нужно передавать целиком
Цены/лимиты зависят от версии (snapshot/stable), региона и режима (thinking/non-thinking)
Доступность отдельных моделей (напр., Qwen-Long) может быть региональной

Сравнение цен

Чат (подписка)

Провайдер	План / уровень	Цена (как в оф. источнике)	Ссылка
OpenAI	ChatGPT Plus	$20 / месяц	прайсинг
Anthropic	Claude Pro	$20 / месяц (или $17/мес при годовой оплате)	прайсинг
Google	Google AI Pro	$19.99 / месяц	прайсинг
Mistral	Mistral Pro (Le Chat)	$14.99 / месяц	прайсинг

API (модели)

Провайдер	Модель / ID	in (hit), $/1M	out, $/1M	Ссылка
Alibaba Cloud	`qwen-max`	— / $1.60	$6.40	прайсинг
OpenAI	`gpt-5`	$1.25	$10.00	прайсинг
OpenAI	`gpt-4o-mini`	$0.15	$0.60	прайсинг
Anthropic	`Claude Opus 4.1`	$3.00	$15.00	прайсинг
Google	`gemini-2.5-pro`	$0.10	$0.40	прайсинг
xAI	`grok-4`	$3.00	$15.00	прайсинг
Mistral	`devstral-medium-2507`	$0.40	$2.00	прайсинг

Бенчмарки

Провайдер	Модель / ID	GPQA (Diamond)	MMLU	MMLU Pro	DROP (F1)	HumanEval (pass@1)	Источник
Alibaba Cloud	Qwen2.5-Max	60.1%	не указано	76.1%	не указано	не указано	официально
Alibaba Cloud	Qwen2.5-72B-Instruct	не указано	86.1%	58.1%	не указано	59.1%	официально
Alibaba Cloud	Qwen2.5-32B-Instruct	48.0%	83.3%	55.1%	не указано	58.5%	официально
Alibaba Cloud	Qwen2.5-14B-Instruct	32.8%	79.7%	51.2%	не указано	56.7%	официально
Alibaba Cloud	Qwen2.5-7B-Instruct	36.4%	74.2%	45.0%	не указано	не указано	официально
Anthropic	Claude 3.5 Sonnet	67.2%	90.4%	77.6%	87.1%	93.7%	официально
OpenAI	GPT-4.1 nano	50.3%	80.1%	не указано	не указано	не указано	официально
Meta	Llama 3.1 405B Instruct	50.7%	87.3%	73.3%	84.8%	89.0%	официально
xAI	Grok 3	84.6%	не указано	79.9%	не указано	не указано	официально

Новости

Alibaba реорганизует команду Qwen: кадровая турбулентность на фоне гонки за AGI

Alibaba Group меняет структуру управления ИИ-разработками после ухода ключевых архитекторов модели Qwen и усиливает маркетинговое давление на конкурентов.

Институт Аллена выпустил новую версию гибридной модели Olmo Hybrid 7B

Архитектура Olmo Hybrid демонстрирует двукратный прирост эффективности обучения, однако проблемы с открытым ПО и инференсом мешают массовому внедрению технологии.

Главный архитектор модели Qwen уходит из Alibaba: конец эпохи открытого ИИ в Китае?

Главный архитектор моделей Qwen Джастин Линь покинул Alibaba. Его уход усилил сомнения в перспективах китайской ИИ-экосистемы и вызвал падение акций компании.

Qwen-Image-i2L: модель, которая генерирует адаптеры LoRA из изображений за один проход

Модель Qwen-Image-i2L генерирует веса адаптера LoRA из изображения за один проход, заменяя часы обучения. Пока она лучше извлекает стиль, чем конкретное содержание, открывая путь к мгновенной персонализации диффузионных моделей.

Оптимизатор Muon показал лучшие результаты при тонкой настройке языковых моделей

Гибридный оптимизатор Muon+AdamW показал лучшие результаты при тонкой настройке языковых моделей, превзойдя как чистый Muon, так и AdamW в экспериментах с Qwen3 4B.

Новый метод улучшения языковых моделей через прямое редактирование весов

Эксперимент с прямой модификацией тензоров языковой модели показал 5-кратное улучшение производительности без традиционного обучения. Новый подход может изменить методы оптимизации ИИ.