Оглавление

Amazon представила новый подход к созданию голосовых ассистентов на основе многокомпонентной архитектуры, объединяющей технологию Amazon Nova Sonic и платформу Amazon Bedrock AgentCore. Решение позволяет строить сложные голосовые системы с распределенными специализированными агентами для различных задач.

Почему многокомпонентная архитектура?

Представьте разработку финансового ассистента, отвечающего за онбординг пользователей, сбор информации, проверку идентификации, запросы по счетам и передачу человеческим операторам. По мере роста функциональных требований система усложняется, становится монолитной и трудной в поддержке.

Многокомпонентная архитектура решает эту проблему, создавая команду специализированных ИИ-помощников вместо одного универсального решения. Каждый агент становится экспертом в своей области — проверка данных, обработка запросов, специализированные операции. Для пользователя опыт остается бесшовным: нет задержек, смены голоса или видимых переходов между агентами.

Многокомпонентные системы — это эволюция от монолитных ИИ-ассистентов к распределенным архитектурам, напоминающим микросервисный подход в enterprise-разработке. Интересно, что Amazon идет по пути децентрализации ИИ-функционала, что противоречит тренду на создание универсальных супер-моделей. Возможно, это более практичный подход для реальных бизнес-приложений, где надежность и специализация важнее универсальности.

Пример банковского приложения

В демонстрационном примере из воркшопа Amazon Nova Sonic используется банковский голосовой ассистент с тремя специализированными агентами:

  • Агент аутентификации: обрабатывает проверку пользователей по идентификаторам счетов
  • Банковский агент: управляет проверкой балансов, выписками и другими банковскими операциями
  • Ипотечный агент: занимается вопросами рефинансирования, ставками и условиями погашения
Диаграмма архитектуры многокомпонентных голосовых ассистентов Amazon Nova Sonic
Источник: aws.amazon.com

Каждый суб-агент самодостаточен и обрабатывает собственную логику, включая валидацию входных данных. Например, агент аутентификации проверяет идентификаторы счетов и возвращает ошибки в Nova Sonic при необходимости.

Интеграция через инструменты событий

Amazon Nova Sonic использует механизм инструментов для интеграции с агентскими рабочими процессами. В жизненном цикле событий Nova Sonic можно настроить использование инструментов через событие promptStart, которое активируется при получении определенных типов входных данных.

В конфигурации инструментов Sonic настраивается инициация событий на основе встроенной модели рассуждений, которая классифицирует запросы для маршрутизации к банковским суб-агентам.

Исходный код примера доступен в репозитории GitHub.

Преимущества подхода

Помимо модульности и надежности, многокомпонентные системы предлагают преимущества, аналогичные микросервисной архитектуре — популярному паттерну проектирования корпоративного программного обеспечения:

  • Масштабируемость: возможность независимого масштабирования отдельных компонентов
  • Распределенность: изоляция функциональности между различными агентами
  • Поддерживаемость: упрощение разработки и тестирования отдельных модулей
  • Переиспользование: возможность повторного использования уже разработанных рабочих процессов

По материалам AWS Machine Learning Blog.