Оглавление

Компания Infosys разработала специализированное решение на базе генеративного ИИ для обработки сложных мультимодальных данных в нефтегазовой отрасли. Система построена на Amazon Bedrock и использует возможности Infosys Topaz для анализа технической документации, включая текстовые отчеты, диаграммы и числовые данные.

Архитектура решения

Решение использует комплексный стек технологий AWS для обработки специализированной документации:

  • Обработка документов – PyMuPDF для парсинга PDF, OpenCV для работы с изображениями
  • Векторные embedding – Cohere Embed English для создания векторных представлений
  • Хранилище – Amazon OpenSearch Serverless с гибридным поиском
  • Модель – Amazon Nova Pro для генерации доменно-специфичных ответов
  • Ранжирование – BGE reranker для улучшения релевантности результатов
Диаграмма архитектуры генеративного ИИ для обработки данных бурения нефти и газа
Источник: aws.amazon.com

Особенности подхода

Система использует иерархическую архитектуру дробления «родитель-потомок», которая сохраняет структурные связи в документах. Это критически важно для технической документации, где контекст между текстом, таблицами и диаграммами неразрывно связан.

Примеры данных по бурению нефти и газа: графики производительности и сечения буровых инструментов
Источник: aws.amazon.com

Для обработки изображений (литологические диаграммы, схемы оборудования, визуализации бурения) применялась многоуровневая стратегия промптинга с использованием мультимодальной модели Amazon Nova Pro.

Это классический пример того, как специализированные RAG-решения превосходят универсальные подходы. Вместо попыток адаптировать общую архитектуру под узкую специфическую задачу, Infosys построила систему с нуля с учетом особенностей нефтегазовой документации. Особенно впечатляет работа с мультимодальными данными — большинство существующих решений до сих пор фокусируются только на тексте.

Практическая ценность

Решение позволяет автоматизировать обработку тысяч страниц технической документации, которые ранее требовали ручного анализа. Это ускоряет принятие операционных решений и снижает риски человеческих ошибок при интерпретации сложных технических данных.

Материал с сайта: AWS Machine Learning Blog.