Факты

Название Alibaba Qwen
Официальный сайт qwen.ai
Документация alibabacloud.com — Model Studio
Чат chat.qwen.ai
Страна / HQ не указано
Разработчик Alibaba Cloud / Qwen Team (Alibaba Group)
Доступы

Быстрые ссылки

История релизов

  • 2025-08-01 — Qwen-Plus-latest обновлён до снапшота 2025-07-28; введён 1M контекст и tiered-прайсинг — ссылка
  • 2025-07-23 — Релиз Qwen3-Coder — ссылка
  • 2025-06-30 — Апгрейд Qwen-Plus/Turbo в Model Studio — ссылка
  • 2025-04-29 — Анонс семейства Qwen3 — ссылка

Модели (API)

ID (для API) Тип / режим Контекст Кратко Поддержка / ограничения Цены ($/1M) Документация
qwen-max / qwen-max-latest Текст 32,768; max in 30,720; max out 8,192 Флагман для сложных многошаговых задач.
  • Deep thinking: нет
  • Batch calls: -50% к цене
in (miss): $1.6; out: $6.4 документация
qwen-plus / qwen-plus-latest Текст (в т.ч. deep thinking) Stable: 131,072; Latest: до 1,000,000; max out 16,384 Баланс цена/скорость/качество; снапшоты Qwen3.
  • Deep thinking: да (отдельные тарифы)
  • Tiered pricing по длине входа
Stable (пример): in $0.4; out non-thinking $1.2 (см. страницу для thinking и 1M контекста) документация
qwen-flash / qwen-flash-2025-07-28 Текст (экономичная) до 1,000,000; max out 32,768 Быстрая и дешёвая; посекционный прайсинг.
  • Кэш контекста: да
  • Batch calls: -50% к цене
in (≤256K): $0.05; in (>256K–1M): $0.25; out: $0.4 или $2.0 документация
qwen3-coder-plus-2025-07-22 Код (agentic) до 1,000,000; max out 65,536 Максимальные возможности для программирования и агентных сценариев.
  • Tiered pricing (0–32K, 32–128K, 128–256K, 256K–1M)
  • Кэш: нет (для этой версии)
in: $1→$6; out: $5→$60 (по ступеням) документация
qwen3-coder-flash / 2025-07-28 Код (экономичная) ступенчатые лимиты Ускоренная код-модель с кэшем.
  • Кэш контекста: да (цены на кэш отдельно)
  • Tiered pricing
in: $0.3→$1.6; out: $1.5→$9.6; cache in: $0.08→$0.4 документация
qwen-vl-max Визуальная (понимание) 131,072; max in 129,024; max out 8,192 Старшая VL-модель для сложного визуального анализа.
  • Токены изображения: ~1 на 28×28 пикс.
  • Снапшоты с улучшениями математики/детекции
in (miss): $0.8; out: $3.2 документация
qwen-vl-plus Визуальная (сбалансированная) 131,072; max in 129,024; max out 8,192 Баланс цены и качества для CV-задач.
  • До 16,384 токенов на изображение
  • Свежие снапшоты (улучшение детекции/локализации)
in (miss): $0.21; out: $0.63 документация

Ключевые особенности

  • OpenAI-совместимый вызов API; также доступ через DashScope/Model Studio
  • Режим deep thinking для Plus/Flash (ограничения по моделям)
  • Кэш контекста (уменьшение стоимости для повторов)
  • Пакетные вызовы (batch) со снижением цены
  • Снапшоты моделей (stable/latest) и 1M контекст у ряда моделей
  • Отдельные мультимодальные линии: Qwen-VL, Omni, OCR, MT

Рекомендации по применению

  • Qwen-Plus — универсальные ассистенты, аналитика, инструменты с moderate сложностью
  • Qwen-Flash — массовые и дешёвые пайплайны с кэшем/батчем
  • Qwen-Max — сложные, многошаговые задачи и long-form планирование
  • Qwen-VL (Plus/Max) — OCR/таблицы/мультиязычный CV-анализ

Ограничения и риски

  • Цены и доступность зависят от региона (Singapore/Beijing и др.)
  • Qwen-Max: deep thinking не поддерживается
  • Tiered pricing усложняет прогноз бюджета для длинных запросов
  • Поведение latest-снапшотов меняется; для стабильности используйте stable/snapshot

Сравнение цен

Чат (подписка)

Провайдер План / уровень Цена (как в оф. источнике) Ссылка
OpenAI ChatGPT Plus $20 / месяц прайсинг
Anthropic Claude Pro $20 / месяц (или $17/мес при годовой) прайсинг
Google Google AI Pro $19.99 / месяц прайсинг
Mistral Mistral Pro (Le Chat) $14.99 / месяц прайсинг

API (модели)

Провайдер Модель / ID in, $/1M out, $/1M Ссылка
Alibaba qwen-plus (Stable, ≤129K) $0.40 $1.20 прайсинг
OpenAI gpt-5 $1.25 $10.00 прайсинг
Google gemini-2.5-pro (≤200K) $1.25 $10.00 прайсинг
Anthropic Claude Sonnet 4 $3.00 $15.00 прайсинг
xAI grok-4 $3.00 $15.00 прайсинг
Mistral devstral-medium-2507 $0.40 $2.00 прайсинг