Amazon Q Business, ИИ-ассистент для корпоративных данных, получил принципиально новый механизм обработки сложных запросов с помощью агентного RAG (Retrieval Augmented Generation). Как сообщает AWS Machine Learning Blog, вместо одноэтапного поиска система теперь использует автономных агентов, динамически планирующих многошаговые стратегии работы с информацией.
Эволюция RAG: от простого к агентному
Традиционный RAG работает по принципу «запрос-поиск-ответ», эффективному для простых фактологических вопросов. Однако в корпоративной среде сотрудники часто формулируют комплексные запросы: сравнение политик разных филиалов, анализ финансовых показателей за несколько кварталов или интерпретация юридических документов. Старая модель либо давала неполные ответы, либо оставляла пользователей в неведении о процессе обработки.
Как работает агентный RAG
Новая архитектура реализует четыре ключевые функции:
- Декомпозиция запросов: Агенты разбивают сложный вопрос на подзадачи. Например, запрос «Сравните отпускные политики в Калифорнии и Вашингтоне» преобразуется в два независимых поисковых задания.
- Прозрачность процессов: Пользователи видят этапы обработки в реальном времени — от разбивки запроса до путей поиска документов
Источник: aws.amazon.com . После формирования ответа детали сворачиваются.
- Интеллектуальное использование инструментов: Агенты выбирают оптимальные методы из арсенала Amazon Q:
- Табличный поиск (анализ XLSX/CSV и таблиц в документах)
- Длинноформатное извлечение (например, для суммаризации годовых отчётов 10-K)
- Оптимизация ответов: LLM синтезирует данные из разрозненных источников в структурированный вывод
Источник: aws.amazon.com
Это не революция, а закономерная эволюция RAG. Главное достижение — переход от статичного поиска к динамическому планированию, что критично для корпоративных задач. Прозрачность обработки снижает «эффект чёрного ящика», повышая доверие пользователей. Однако остаются вопросы к масштабируемости: многоагентные системы требуют больше вычислительных ресурсов. AWS делает ставку на то, что рост затрат оправдается для enterprise-клиентов, где цена ошибки в ответах высока. Пока это самый продвинутый вариант RAG на рынке — посмотрим, ответят ли конкуренты аналогичными решениями.
Оставить комментарий