Оглавление
Amazon представила новый подход к созданию голосовых ассистентов на основе многокомпонентной архитектуры, объединяющей технологию Amazon Nova Sonic и платформу Amazon Bedrock AgentCore. Решение позволяет строить сложные голосовые системы с распределенными специализированными агентами для различных задач.
Почему многокомпонентная архитектура?
Представьте разработку финансового ассистента, отвечающего за онбординг пользователей, сбор информации, проверку идентификации, запросы по счетам и передачу человеческим операторам. По мере роста функциональных требований система усложняется, становится монолитной и трудной в поддержке.
Многокомпонентная архитектура решает эту проблему, создавая команду специализированных ИИ-помощников вместо одного универсального решения. Каждый агент становится экспертом в своей области — проверка данных, обработка запросов, специализированные операции. Для пользователя опыт остается бесшовным: нет задержек, смены голоса или видимых переходов между агентами.
Многокомпонентные системы — это эволюция от монолитных ИИ-ассистентов к распределенным архитектурам, напоминающим микросервисный подход в enterprise-разработке. Интересно, что Amazon идет по пути децентрализации ИИ-функционала, что противоречит тренду на создание универсальных супер-моделей. Возможно, это более практичный подход для реальных бизнес-приложений, где надежность и специализация важнее универсальности.
Пример банковского приложения
В демонстрационном примере из воркшопа Amazon Nova Sonic используется банковский голосовой ассистент с тремя специализированными агентами:
- Агент аутентификации: обрабатывает проверку пользователей по идентификаторам счетов
- Банковский агент: управляет проверкой балансов, выписками и другими банковскими операциями
- Ипотечный агент: занимается вопросами рефинансирования, ставками и условиями погашения

Каждый суб-агент самодостаточен и обрабатывает собственную логику, включая валидацию входных данных. Например, агент аутентификации проверяет идентификаторы счетов и возвращает ошибки в Nova Sonic при необходимости.
Интеграция через инструменты событий
Amazon Nova Sonic использует механизм инструментов для интеграции с агентскими рабочими процессами. В жизненном цикле событий Nova Sonic можно настроить использование инструментов через событие promptStart, которое активируется при получении определенных типов входных данных.
В конфигурации инструментов Sonic настраивается инициация событий на основе встроенной модели рассуждений, которая классифицирует запросы для маршрутизации к банковским суб-агентам.
Исходный код примера доступен в репозитории GitHub.
Преимущества подхода
Помимо модульности и надежности, многокомпонентные системы предлагают преимущества, аналогичные микросервисной архитектуре — популярному паттерну проектирования корпоративного программного обеспечения:
- Масштабируемость: возможность независимого масштабирования отдельных компонентов
- Распределенность: изоляция функциональности между различными агентами
- Поддерживаемость: упрощение разработки и тестирования отдельных модулей
- Переиспользование: возможность повторного использования уже разработанных рабочих процессов
По материалам AWS Machine Learning Blog.
Оставить комментарий