Оглавление

Amazon Q Business, ИИ-ассистент для корпоративных данных, получил принципиально новый механизм обработки сложных запросов с помощью агентного RAG (Retrieval Augmented Generation). Как сообщает AWS Machine Learning Blog, вместо одноэтапного поиска система теперь использует автономных агентов, динамически планирующих многошаговые стратегии работы с информацией.

Эволюция RAG: от простого к агентному

Традиционный RAG работает по принципу «запрос-поиск-ответ», эффективному для простых фактологических вопросов. Однако в корпоративной среде сотрудники часто формулируют комплексные запросы: сравнение политик разных филиалов, анализ финансовых показателей за несколько кварталов или интерпретация юридических документов. Старая модель либо давала неполные ответы, либо оставляла пользователей в неведении о процессе обработки.

Как работает агентный RAG

Новая архитектура реализует четыре ключевые функции:

  • Декомпозиция запросов: Агенты разбивают сложный вопрос на подзадачи. Например, запрос «Сравните отпускные политики в Калифорнии и Вашингтоне» преобразуется в два независимых поисковых задания.
  • Прозрачность процессов: Пользователи видят этапы обработки в реальном времени — от разбивки запроса до путей поиска документов
    Процесс декомпозиции и поиска запросов в Amazon Q Business
    Источник: aws.amazon.com

    . После формирования ответа детали сворачиваются.

  • Интеллектуальное использование инструментов: Агенты выбирают оптимальные методы из арсенала Amazon Q:
    • Табличный поиск (анализ XLSX/CSV и таблиц в документах)
    • Длинноформатное извлечение (например, для суммаризации годовых отчётов 10-K)
  • Оптимизация ответов: LLM синтезирует данные из разрозненных источников в структурированный вывод
    Сравнение политик отпусков в формате markdown
    Источник: aws.amazon.com

Это не революция, а закономерная эволюция RAG. Главное достижение — переход от статичного поиска к динамическому планированию, что критично для корпоративных задач. Прозрачность обработки снижает «эффект чёрного ящика», повышая доверие пользователей. Однако остаются вопросы к масштабируемости: многоагентные системы требуют больше вычислительных ресурсов. AWS делает ставку на то, что рост затрат оправдается для enterprise-клиентов, где цена ошибки в ответах высока. Пока это самый продвинутый вариант RAG на рынке — посмотрим, ответят ли конкуренты аналогичными решениями.