Оглавление
Команда Qwen от Alibaba представила масштабное обновление своего инструмента Deep Research, который теперь может превращать исследовательские отчеты в полноценные веб-страницы и многоголосые подкасты буквально в пару кликов.
От текста к мультимедиа
Новая функциональность является частью собственной разработки, что отличает его от многих предыдущих открытых моделей Qwen. Хотя функция использует открытые модели Qwen3-Coder, Qwen-Image и Qwen3-TTS для базовых возможностей, весь пользовательский опыт — от исследования до развертывания веб-страниц и генерации аудио — полностью управляется Qwen.
Это означает, что пользователи получают готовый рабочий процесс без необходимости настройки инфраструктуры. При этом разработчики, имеющие доступ к открытым моделям, теоретически могут воспроизвести аналогичную функциональность в частных или коммерческих системах.
Как работает процесс
Рабочий процесс начинается с пользовательского запроса в интерфейсе Qwen Chat. Далее Qwen задает уточняющие вопросы для определения объема исследования, собирает данные из интернета и официальных источников, анализирует и разрешает найденные несоответствия — даже генерирует пользовательский код при необходимости.
После завершения исследования пользователи могут кликнуть на значок «глаз» под результатом, что откроет отчет в PDF-стиле в правой панели.
Затем при просмотре отчета в правой панели пользователь может нажать кнопку «Create» в верхнем правом углу и выбрать из двух опций:
- «Web Dev» — создает готовую профессиональную веб-страницу, автоматически развернутую и размещенную на серверах Qwen, с использованием Qwen3-Coder для структуры и Qwen-Image для визуалов
- «Podcast» — генерирует аудио подкаст с динамическим многоголосым озвучиванием через Qwen3-TTS, также размещенный на платформе Qwen для легкого распространения и воспроизведения
Особенности мультиформатного вывода
Веб-сайт включает встроенную графику, сгенерированную Qwen Image, что делает его подходящим для публичных презентаций, учебных аудиторий или публикаций.
Функция подкаста позволяет пользователям выбирать между 17 различными именами ведущих и 7 — соведущих. Однако предварительного прослушивания голосов перед выбором не предусмотрено. Инструмент явно предназначен для глубокого прослушивания в дороге.
Интересно наблюдать, как китайские разработчики догоняют и пытаются обойти западных конкурентов в области AI-инструментов для создания контента. Qwen делает ставку на комплексность — один инструмент вместо трех разных сервисов. Вопрос в том, сможет ли эта универсальность конкурировать со специализированными решениями вроде NotebookLM от Google, которые фокусируются на глубине интеграции с существующими документами и заметками.
Сравнение с конкурентами
Хотя новые возможности получили положительные отзывы от многих ранних пользователей, появились сравнения с другими исследовательскими ассистентами — в частности, с NotebookLM от Google, который недавно вышел из бета-версии.
Комментатор в области ИИ и автор рассылки Chubby (@kimmonismus) отметил в X: «Я действительно благодарен, что Qwen предоставляет регулярные обновления. Это прекрасно. Но попытка создать клон NotebookLM внутри Qwen-3-max не звучит очень перспективно по сравнению с версией Google».
В то время как NotebookLM построен вокруг организации и запросов к существующим документам и веб-страницам, Qwen Deep Research фокусируется больше на генерации нового исследовательского контента с нуля, агрегировании источников из открытого интернета и представлении его в различных модальностях.
Доступность и перспективы
Qwen Deep Research уже доступен через приложение Qwen Chat. Функция доступна по ссылке. Информация о ценах для Qwen3-Max или конкретных возможностей Deep Research на момент публикации не предоставлена.
Объединяя исследовательское руководство, анализ данных и создание контента в нескольких форматах в одном инструменте, Qwen Deep Research стремится упростить путь от идеи до публикуемого результата.
Интеграция кода, визуалов и голоса делает его особенно привлекательным для создателей контента, преподавателей и независимых аналитиков, которые хотят масштабировать свои исследования в веб- или подкаст-форматы без смены платформ.
Тем не менее сравнения с более специализированными предложениями, такими как NotebookLM, поднимают вопросы о том, как обобщенный подход Qwen выглядит с точки зрения глубины, точности и отточенности. Перевесит ли сила его мультиформатного исполнения эти опасения — зависит от приоритетов пользователей и от того, ценят ли они публикацию в один клик больше, чем тесную интеграцию с существующими заметками и материалами.
По материалам VentureBeat.
Оставить комментарий