Модели (API)
ID (для API) | Тип / режим | Контекст | Кратко | Поддержка / ограничения | Цены ($/1M) | Документация |
---|---|---|---|---|---|---|
qwen-max | Универсальная (текст) | 32,768; max out 8,192 | Флагман среди текстовых Qwen. |
|
in (hit): не указано; in (miss): $1.6; out: $6.4 | документация |
qwen-plus | Универсальная (thinking / non-thinking) | до 1,000,000 (по версии) | Баланс качества/стоимости; режимы thinking/non-thinking. |
|
in (hit): не указано; in (miss): $0.115; out: $0.287 | документация |
qwen-flash | Универсальная (экономичная) | до 1,000,000 | Модель с пониженной ценой/латентностью. |
|
in (hit): не указано; in (miss): $0.05–0.25; out: $0.40–2.00 | документация |
qwen3-coder-plus | Код (Reasoning/Tool-Use) | до 1,000,000 | Коммерческая код-модель серии Qwen3-Coder. |
|
in (hit): не указано; in (miss): $1.00–6.00; out: $5.00–60.00 | документация |
qwen3-coder-flash | Код (экономичная) | до 1,000,000 | Ускоренная/дешёвая код-модель. |
|
in (hit): не указано; in (miss): $0.05–0.25; out: $0.40–2.00 | документация |
qwen-vl-max | Мультимодальная (vision) | 131,072; max out 8,192 | Визуальное понимание/рассуждение; до 16,384 токенов на изображение. |
|
in (hit): не указано; in (miss): $0.8; out: $3.2 | документация |
qwen-vl-plus | Мультимодальная (vision, экономичная) | 131,072; max out 8,192 | Баланс цены и качества в Qwen-VL. |
|
in (hit): не указано; in (miss): $0.21; out: $0.63 | документация |
Ключевые особенности
- OpenAI-совместимый интерфейс (Chat/Completions) в Model Studio
- Режимы thinking/non-thinking у отдельных моделей (например, Qwen-Plus)
- Контексты до 1M токенов у моделей Flash/Coder
- Отдельные мультимодальные модели: Qwen-VL (vision), QVQ (visual reasoning)
- Официальная страница «Models & Pricing» с тарифами в USD
- Статус-страница Alibaba Cloud
Рекомендации по применению
- Qwen-Max / Qwen-Plus — универсальные ассистенты и сложные многошаговые задачи
- Qwen-Flash — дешёвые/длинные запросы с большим контекстом
- Qwen3-Coder — кодинг, агентные сценарии и tool-use
- Qwen-VL — OCR, извлечение атрибутов и визуальное рассуждение
Ограничения и риски
- Qwen-Max: «deep thinking» не поддерживается
- API не хранит историю диалога; контекст нужно передавать целиком
- Цены/лимиты зависят от версии (snapshot/stable), региона и режима (thinking/non-thinking)
- Доступность отдельных моделей (напр., Qwen-Long) может быть региональной
Сравнение цен
Чат (подписка)
API (модели)
Провайдер | Модель / ID | in (hit), $/1M | out, $/1M | Ссылка |
---|---|---|---|---|
Alibaba Cloud | qwen-max |
— / $1.60 | $6.40 | прайсинг |
OpenAI | gpt-5 |
$1.25 | $10.00 | прайсинг |
OpenAI | gpt-4o-mini |
$0.15 | $0.60 | прайсинг |
Anthropic | Claude Opus 4.1 |
$3.00 | $15.00 | прайсинг |
gemini-2.5-pro |
$0.10 | $0.40 | прайсинг | |
xAI | grok-4 |
$3.00 | $15.00 | прайсинг |
Mistral | devstral-medium-2507 |
$0.40 | $2.00 | прайсинг |
Бенчмарки
Провайдер | Модель / ID | GPQA (Diamond) | MMLU | MMLU Pro | DROP (F1) | HumanEval (pass@1) | Источник |
---|---|---|---|---|---|---|---|
Alibaba Cloud | Qwen2.5-Max | 60.1% | не указано | 76.1% | не указано | не указано | официально |
Alibaba Cloud | Qwen2.5-72B-Instruct | не указано | 86.1% | 58.1% | не указано | 59.1% | официально |
Alibaba Cloud | Qwen2.5-32B-Instruct | 48.0% | 83.3% | 55.1% | не указано | 58.5% | официально |
Alibaba Cloud | Qwen2.5-14B-Instruct | 32.8% | 79.7% | 51.2% | не указано | 56.7% | официально |
Alibaba Cloud | Qwen2.5-7B-Instruct | 36.4% | 74.2% | 45.0% | не указано | не указано | официально |
Anthropic | Claude 3.5 Sonnet | 67.2% | 90.4% | 77.6% | 87.1% | 93.7% | официально |
OpenAI | GPT-4.1 nano | 50.3% | 80.1% | не указано | не указано | не указано | официально |
Meta | Llama 3.1 405B Instruct | 50.7% | 87.3% | 73.3% | 84.8% | 89.0% | официально |
xAI | Grok 3 | 84.6% | не указано | 79.9% | не указано | не указано | официально |