Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1M) Документация
qwen-max Универсальная (текст) 32,768; max out 8,192 Флагман среди текстовых Qwen.
  • OpenAI-совместимый интерфейс
  • Deep thinking: нет
in (hit): не указано; in (miss): $1.6; out: $6.4 документация
qwen-plus Универсальная (thinking / non-thinking) до 1,000,000 (по версии) Баланс качества/стоимости; режимы thinking/non-thinking.
  • OpenAI-совместимый интерфейс
  • Thinking — отдельная тарификация
in (hit): не указано; in (miss): $0.115; out: $0.287 документация
qwen-flash Универсальная (экономичная) до 1,000,000 Модель с пониженной ценой/латентностью.
  • OpenAI-совместимый интерфейс
  • Тариф зависит от длины контекста
in (hit): не указано; in (miss): $0.05–0.25; out: $0.40–2.00 документация
qwen3-coder-plus Код (Reasoning/Tool-Use) до 1,000,000 Коммерческая код-модель серии Qwen3-Coder.
  • OpenAI-совместимый интерфейс
  • Тариф по диапазонам токенов
in (hit): не указано; in (miss): $1.00–6.00; out: $5.00–60.00 документация
qwen3-coder-flash Код (экономичная) до 1,000,000 Ускоренная/дешёвая код-модель.
  • OpenAI-совместимый интерфейс
  • Тариф по диапазонам токенов
in (hit): не указано; in (miss): $0.05–0.25; out: $0.40–2.00 документация
qwen-vl-max Мультимодальная (vision) 131,072; max out 8,192 Визуальное понимание/рассуждение; до 16,384 токенов на изображение.
  • Оплата за текстовые и «image tokens»
  • OpenAI-совместимый интерфейс
in (hit): не указано; in (miss): $0.8; out: $3.2 документация
qwen-vl-plus Мультимодальная (vision, экономичная) 131,072; max out 8,192 Баланс цены и качества в Qwen-VL.
  • Оплата за текстовые и «image tokens»
  • OpenAI-совместимый интерфейс
in (hit): не указано; in (miss): $0.21; out: $0.63 документация

Ключевые особенности

  • OpenAI-совместимый интерфейс (Chat/Completions) в Model Studio
  • Режимы thinking/non-thinking у отдельных моделей (например, Qwen-Plus)
  • Контексты до 1M токенов у моделей Flash/Coder
  • Отдельные мультимодальные модели: Qwen-VL (vision), QVQ (visual reasoning)
  • Официальная страница «Models & Pricing» с тарифами в USD
  • Статус-страница Alibaba Cloud

Рекомендации по применению

  • Qwen-Max / Qwen-Plus — универсальные ассистенты и сложные многошаговые задачи
  • Qwen-Flash — дешёвые/длинные запросы с большим контекстом
  • Qwen3-Coder — кодинг, агентные сценарии и tool-use
  • Qwen-VL — OCR, извлечение атрибутов и визуальное рассуждение

Ограничения и риски

  • Qwen-Max: «deep thinking» не поддерживается
  • API не хранит историю диалога; контекст нужно передавать целиком
  • Цены/лимиты зависят от версии (snapshot/stable), региона и режима (thinking/non-thinking)
  • Доступность отдельных моделей (напр., Qwen-Long) может быть региональной

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (как в оф. источнике) Ссылка
OpenAI ChatGPT Plus $20 / месяц прайсинг
Anthropic Claude Pro $20 / месяц (или $17/мес при годовой оплате) прайсинг
Google Google AI Pro $19.99 / месяц прайсинг
Mistral Mistral Pro (Le Chat) $14.99 / месяц прайсинг

API (модели)

Провайдер Модель / ID in (hit), $/1M out, $/1M Ссылка
Alibaba Cloud qwen-max — / $1.60 $6.40 прайсинг
OpenAI gpt-5 $1.25 $10.00 прайсинг
OpenAI gpt-4o-mini $0.15 $0.60 прайсинг
Anthropic Claude Opus 4.1 $3.00 $15.00 прайсинг
Google gemini-2.5-pro $0.10 $0.40 прайсинг
xAI grok-4 $3.00 $15.00 прайсинг
Mistral devstral-medium-2507 $0.40 $2.00 прайсинг

Бенчмарки

Провайдер Модель / ID GPQA (Diamond) MMLU MMLU Pro DROP (F1) HumanEval (pass@1) Источник
Alibaba Cloud Qwen2.5-Max 60.1% не указано 76.1% не указано не указано официально
Alibaba Cloud Qwen2.5-72B-Instruct не указано 86.1% 58.1% не указано 59.1% официально
Alibaba Cloud Qwen2.5-32B-Instruct 48.0% 83.3% 55.1% не указано 58.5% официально
Alibaba Cloud Qwen2.5-14B-Instruct 32.8% 79.7% 51.2% не указано 56.7% официально
Alibaba Cloud Qwen2.5-7B-Instruct 36.4% 74.2% 45.0% не указано не указано официально
Anthropic Claude 3.5 Sonnet 67.2% 90.4% 77.6% 87.1% 93.7% официально
OpenAI GPT-4.1 nano 50.3% 80.1% не указано не указано не указано официально
Meta Llama 3.1 405B Instruct 50.7% 87.3% 73.3% 84.8% 89.0% официально
xAI Grok 3 84.6% не указано 79.9% не указано не указано официально