Оглавление

Компании в регулируемых отраслях сталкиваются с уникальной проблемой: как обеспечить абсолютную уверенность в том, что каждый ответ искусственного интеллекта соответствует установленным политикам и отраслевым знаниям. Традиционные методы тестирования выборок статистических данных здесь не работают — требуется математическая определенность.

Автоматизированная проверка рассуждений в действии

Amazon Bedrock Guardrails с функцией Automated Reasoning checks предлагает решение, применяющее методы формальной верификации для систематической проверки выходных данных ИИ против закодированных бизнес-правил. Эти методы делают процесс валидации прозрачным и объяснимым.

Технология уже используется в различных отраслях: финансовые учреждения проверяют соответствие инвестиционных рекомендаций регуляторным требованиям, медицинские организации убеждаются в соответствии рекомендаций пациентов клиническим протоколам, фармацевтические компании подтверждают маркетинговые заявления доказательствами, одобренными FDA.

Формальная верификация в ИИ — это как переход от вероятностного анализа к математическому доказательству. Вместо «вероятно соответствует правилам» мы получаем «доказано соответствует правилам». Для регулируемых отраслей это разница между риском и гарантией, между надеждой и уверенностью.

Ключевые возможности системы

С выпуском Automated Reasoning в общий доступ Amazon добавил новые функции, включая генерацию сценариев, которая автоматически создает примеры, демонстрирующие политики в действии. Улучшенная система управления тестами позволяет экспертам создавать, сохранять и автоматически выполнять комплексные тестовые наборы.

Система поддерживает обработку до 120 тысяч токенов (примерно 100 страниц), что позволяет кодировать существенные базы знаний и сложные политические документы в правила автоматизированного рассуждения.

API валидации включает:

  • Обнаружение неоднозначностей, идентифицирующее утверждения, требующие уточнения
  • Контрпримеры для недействительных результатов, демонстрирующие причины неудачной валидации
  • Удовлетворительные результаты с примерами как валидных, так и невалидных случаев
Блок-схема рабочего процесса проверки Автоматического Рассуждения
Источник: aws.amazon.com

Итеративный процесс улучшения

Automated Reasoning checks предоставляет детальные, проверяемые результаты, которые объясняют, почему ответ не прошел валидацию. Эта информация может быть передана обратно в базовую модель, позволяя ей корректировать ответы на основе конкретной обратной связи.

Такой подход особенно ценен в регулируемых отраслях, где фактическая точность и соответствие должны быть математически проверены, а не оценены вероятностно. Система также может выражать свою уверенность в переводах между естественным языком и логическими структурами для установки соответствующих порогов для конкретных случаев использования.

По материалам AWS Machine Learning Blog.