Факты
Название | Alibaba Qwen |
Официальный сайт | qwen.ai |
Документация | alibabacloud.com — Model Studio |
Чат | chat.qwen.ai |
Страна / HQ | не указано |
Разработчик | Alibaba Cloud / Qwen Team (Alibaba Group) |
Доступы |
|
Быстрые ссылки
- Документация: Models & Pricing
- API Reference / OpenAI-совместимый вызов
- Deep thinking
- Context cache
- Batch inference
- Rate limits
- Статус
- Privacy
- Terms
- Пресс-релиз Qwen3
История релизов
- 2025-08-01 — Qwen-Plus-latest обновлён до снапшота 2025-07-28; введён 1M контекст и tiered-прайсинг — ссылка
- 2025-07-23 — Релиз Qwen3-Coder — ссылка
- 2025-06-30 — Апгрейд Qwen-Plus/Turbo в Model Studio — ссылка
- 2025-04-29 — Анонс семейства Qwen3 — ссылка
Модели (API)
ID (для API) | Тип / режим | Контекст | Кратко | Поддержка / ограничения | Цены ($/1M) | Документация |
---|---|---|---|---|---|---|
qwen-max / qwen-max-latest | Текст | 32,768; max in 30,720; max out 8,192 | Флагман для сложных многошаговых задач. |
|
in (miss): $1.6; out: $6.4 | документация |
qwen-plus / qwen-plus-latest | Текст (в т.ч. deep thinking) | Stable: 131,072; Latest: до 1,000,000; max out 16,384 | Баланс цена/скорость/качество; снапшоты Qwen3. |
|
Stable (пример): in $0.4; out non-thinking $1.2 (см. страницу для thinking и 1M контекста) | документация |
qwen-flash / qwen-flash-2025-07-28 | Текст (экономичная) | до 1,000,000; max out 32,768 | Быстрая и дешёвая; посекционный прайсинг. |
|
in (≤256K): $0.05; in (>256K–1M): $0.25; out: $0.4 или $2.0 | документация |
qwen3-coder-plus-2025-07-22 | Код (agentic) | до 1,000,000; max out 65,536 | Максимальные возможности для программирования и агентных сценариев. |
|
in: $1→$6; out: $5→$60 (по ступеням) | документация |
qwen3-coder-flash / 2025-07-28 | Код (экономичная) | ступенчатые лимиты | Ускоренная код-модель с кэшем. |
|
in: $0.3→$1.6; out: $1.5→$9.6; cache in: $0.08→$0.4 | документация |
qwen-vl-max | Визуальная (понимание) | 131,072; max in 129,024; max out 8,192 | Старшая VL-модель для сложного визуального анализа. |
|
in (miss): $0.8; out: $3.2 | документация |
qwen-vl-plus | Визуальная (сбалансированная) | 131,072; max in 129,024; max out 8,192 | Баланс цены и качества для CV-задач. |
|
in (miss): $0.21; out: $0.63 | документация |
Ключевые особенности
- OpenAI-совместимый вызов API; также доступ через DashScope/Model Studio
- Режим deep thinking для Plus/Flash (ограничения по моделям)
- Кэш контекста (уменьшение стоимости для повторов)
- Пакетные вызовы (batch) со снижением цены
- Снапшоты моделей (stable/latest) и 1M контекст у ряда моделей
- Отдельные мультимодальные линии: Qwen-VL, Omni, OCR, MT
Рекомендации по применению
- Qwen-Plus — универсальные ассистенты, аналитика, инструменты с moderate сложностью
- Qwen-Flash — массовые и дешёвые пайплайны с кэшем/батчем
- Qwen-Max — сложные, многошаговые задачи и long-form планирование
- Qwen-VL (Plus/Max) — OCR/таблицы/мультиязычный CV-анализ
Ограничения и риски
- Цены и доступность зависят от региона (Singapore/Beijing и др.)
- Qwen-Max: deep thinking не поддерживается
- Tiered pricing усложняет прогноз бюджета для длинных запросов
- Поведение latest-снапшотов меняется; для стабильности используйте stable/snapshot
Сравнение цен
Чат (подписка)
Провайдер | План / уровень | Цена (как в оф. источнике) | Ссылка |
---|---|---|---|
OpenAI | ChatGPT Plus | $20 / месяц | прайсинг |
Anthropic | Claude Pro | $20 / месяц (или $17/мес при годовой) | прайсинг |
Google AI Pro | $19.99 / месяц | прайсинг | |
Mistral | Mistral Pro (Le Chat) | $14.99 / месяц | прайсинг |
API (модели)
Провайдер | Модель / ID | in, $/1M | out, $/1M | Ссылка |
---|---|---|---|---|
Alibaba | qwen-plus (Stable, ≤129K) | $0.40 | $1.20 | прайсинг |
OpenAI | gpt-5 | $1.25 | $10.00 | прайсинг |
gemini-2.5-pro (≤200K) | $1.25 | $10.00 | прайсинг | |
Anthropic | Claude Sonnet 4 | $3.00 | $15.00 | прайсинг |
xAI | grok-4 | $3.00 | $15.00 | прайсинг |
Mistral | devstral-medium-2507 | $0.40 | $2.00 | прайсинг |