Alibaba

Alibaba Qwen — линейка коммерческих и открытых LLM/мультимодальных моделей Alibaba Cloud, доступных через Model Studio и API. Поддерживается OpenAI-совместимый вызов, режим «deep thinking» для части моделей, кэш контекста и пакетные (batch) вызовы; прайсинг — помодельный и по регионам.

Факты

Название	Alibaba Qwen
Официальный сайт	qwen.ai
Документация	alibabacloud.com — Model Studio
Чат	chat.qwen.ai
Страна / HQ	не указано
Разработчик	Alibaba Cloud / Qwen Team (Alibaba Group)
Доступы	API: документация Чат: веб-клиент

Быстрые ссылки

История релизов

2025-08-01 — Qwen-Plus-latest обновлён до снапшота 2025-07-28; введён 1M контекст и tiered-прайсинг — ссылка
2025-07-23 — Релиз Qwen3-Coder — ссылка
2025-06-30 — Апгрейд Qwen-Plus/Turbo в Model Studio — ссылка
2025-04-29 — Анонс семейства Qwen3 — ссылка

Модели (API)

ID (для API)	Тип / режим	Контекст	Кратко	Поддержка / ограничения	Цены ($/1M)	Документация
qwen-max / qwen-max-latest	Текст	32,768; max in 30,720; max out 8,192	Флагман для сложных многошаговых задач.	Deep thinking: нет Batch calls: -50% к цене	in (miss): $1.6; out: $6.4	документация
qwen-plus / qwen-plus-latest	Текст (в т.ч. deep thinking)	Stable: 131,072; Latest: до 1,000,000; max out 16,384	Баланс цена/скорость/качество; снапшоты Qwen3.	Deep thinking: да (отдельные тарифы) Tiered pricing по длине входа	Stable (пример): in $0.4; out non-thinking $1.2 (см. страницу для thinking и 1M контекста)	документация
qwen-flash / qwen-flash-2025-07-28	Текст (экономичная)	до 1,000,000; max out 32,768	Быстрая и дешёвая; посекционный прайсинг.	Кэш контекста: да Batch calls: -50% к цене	in (≤256K): $0.05; in (>256K–1M): $0.25; out: $0.4 или $2.0	документация
qwen3-coder-plus-2025-07-22	Код (agentic)	до 1,000,000; max out 65,536	Максимальные возможности для программирования и агентных сценариев.	Tiered pricing (0–32K, 32–128K, 128–256K, 256K–1M) Кэш: нет (для этой версии)	in: $1→$6; out: $5→$60 (по ступеням)	документация
qwen3-coder-flash / 2025-07-28	Код (экономичная)	ступенчатые лимиты	Ускоренная код-модель с кэшем.	Кэш контекста: да (цены на кэш отдельно) Tiered pricing	in: $0.3→$1.6; out: $1.5→$9.6; cache in: $0.08→$0.4	документация
qwen-vl-max	Визуальная (понимание)	131,072; max in 129,024; max out 8,192	Старшая VL-модель для сложного визуального анализа.	Токены изображения: ~1 на 28×28 пикс. Снапшоты с улучшениями математики/детекции	in (miss): $0.8; out: $3.2	документация
qwen-vl-plus	Визуальная (сбалансированная)	131,072; max in 129,024; max out 8,192	Баланс цены и качества для CV-задач.	До 16,384 токенов на изображение Свежие снапшоты (улучшение детекции/локализации)	in (miss): $0.21; out: $0.63	документация

Ключевые особенности

OpenAI-совместимый вызов API; также доступ через DashScope/Model Studio
Режим deep thinking для Plus/Flash (ограничения по моделям)
Кэш контекста (уменьшение стоимости для повторов)
Пакетные вызовы (batch) со снижением цены
Снапшоты моделей (stable/latest) и 1M контекст у ряда моделей
Отдельные мультимодальные линии: Qwen-VL, Omni, OCR, MT

Ограничения и риски

Цены и доступность зависят от региона (Singapore/Beijing и др.)
Qwen-Max: deep thinking не поддерживается
Tiered pricing усложняет прогноз бюджета для длинных запросов
Поведение latest-снапшотов меняется; для стабильности используйте stable/snapshot

Сравнение цен

Чат (подписка)

Провайдер	План / уровень	Цена (как в оф. источнике)	Ссылка
OpenAI	ChatGPT Plus	$20 / месяц	прайсинг
Anthropic	Claude Pro	$20 / месяц (или $17/мес при годовой)	прайсинг
Google	Google AI Pro	$19.99 / месяц	прайсинг
Mistral	Mistral Pro (Le Chat)	$14.99 / месяц	прайсинг

API (модели)

Провайдер	Модель / ID	in, $/1M	out, $/1M	Ссылка
Alibaba	qwen-plus (Stable, ≤129K)	$0.40	$1.20	прайсинг
OpenAI	gpt-5	$1.25	$10.00	прайсинг
Google	gemini-2.5-pro (≤200K)	$1.25	$10.00	прайсинг
Anthropic	Claude Sonnet 4	$3.00	$15.00	прайсинг
xAI	grok-4	$3.00	$15.00	прайсинг
Mistral	devstral-medium-2507	$0.40	$2.00	прайсинг

Новости

Джек Ма - основатель Alibaba Group и Qwen

Джек Ма вернулся в Alibaba с амбициозными планами по завоеванию рынка

Основатель Alibaba Джек Ма вернулся к активному управлению компанией после нескольких лет отсутствия. Он курирует AI-стратегию и агрессивную борьбу за рынок с бюджетом 50 млрд юаней.

Технология динамической памяти Memp поможет сократить затраты на ИИ-агентов

Новый фреймворк Memp от исследователей Zhejiang University и Alibaba добавляет ИИ-агентам динамическую процедурную память, позволяя им учиться на опыте и сокращать затраты на выполнение сложных задач.

Alibaba разрабатывает новый ИИ-чип для Китая

Alibaba разрабатывает новый AI-чип на фоне призывов Си Цзиньпина к сотрудничеству в ИИ

Alibaba разрабатывает новый процессор для искусственного интеллекта, укрепляя технологический суверенитет Китая на фоне западных санкций и призывов к сотрудничеству.

Alibaba разрабатывает специализированный чип для AI-инференсинга

Alibaba разрабатывает специализированный AI-чип для инференсинга в ответ на экспортные ограничения США. Чип предназначен для выполнения обученных моделей, но не для их тренировки.

AutoBench запускает третий раунд масштабного тестирования LLM

Третий раунд AutoBench протестировал 33 языковые модели с рекордными 300,000 оценок. Запущена платформа autobench.org для прозрачного benchmarking.

GPT Proto запускает доступный API для редактирования изображений на базе Qwen

GPT Proto запустила доступный API для редактирования и генерации изображений на базе моделей Qwen от Alibaba Cloud. Стоимость всего $0.0203 за операцию.