Infosys ИИ система для анализа данных нефтедобычи на Amazon Bedrock

Infosys разработала специализированную ИИ-систему на Amazon Bedrock для обработки сложной технической документации в нефтегазовой отрасли с поддержкой мультимодальных данных.

Оглавление

Архитектура решения
Особенности подхода
Практическая ценность

Компания Infosys разработала специализированное решение на базе генеративного ИИ для обработки сложных мультимодальных данных в нефтегазовой отрасли. Система построена на Amazon Bedrock и использует возможности Infosys Topaz для анализа технической документации, включая текстовые отчеты, диаграммы и числовые данные.

Архитектура решения

Решение использует комплексный стек технологий AWS для обработки специализированной документации:

Обработка документов – PyMuPDF для парсинга PDF, OpenCV для работы с изображениями
Векторные embedding – Cohere Embed English для создания векторных представлений
Хранилище – Amazon OpenSearch Serverless с гибридным поиском
Модель – Amazon Nova Pro для генерации доменно-специфичных ответов
Ранжирование – BGE reranker для улучшения релевантности результатов

Диаграмма архитектуры генеративного ИИ для обработки данных бурения нефти и газа — Источник: aws.amazon.com

Особенности подхода

Система использует иерархическую архитектуру дробления «родитель-потомок», которая сохраняет структурные связи в документах. Это критически важно для технической документации, где контекст между текстом, таблицами и диаграммами неразрывно связан.

Примеры данных по бурению нефти и газа: графики производительности и сечения буровых инструментов — Источник: aws.amazon.com

Для обработки изображений (литологические диаграммы, схемы оборудования, визуализации бурения) применялась многоуровневая стратегия промптинга с использованием мультимодальной модели Amazon Nova Pro.

Это классический пример того, как специализированные RAG-решения превосходят универсальные подходы. Вместо попыток адаптировать общую архитектуру под узкую специфическую задачу, Infosys построила систему с нуля с учетом особенностей нефтегазовой документации. Особенно впечатляет работа с мультимодальными данными — большинство существующих решений до сих пор фокусируются только на тексте.

Практическая ценность

Решение позволяет автоматизировать обработку тысяч страниц технической документации, которые ранее требовали ручного анализа. Это ускоряет принятие операционных решений и снижает риски человеческих ошибок при интерпретации сложных технических данных.

Материал с сайта: AWS Machine Learning Blog.

Новости

Infosys создала ИИ-систему для анализа данных нефтедобычи на Amazon Bedrock

Архитектура решения

Особенности подхода

Практическая ценность

Еще интереснее

Почему масштаб контекста перестал быть главным мерилом эффективности LLM

Новый фреймворк cua-bench решает проблему хрупкости ИИ-агентов для управления компьютером

AWS представил интеграцию SageMaker MLflow и Snowflake для отслеживания ML-экспериментов

Qwen-Image-i2L: модель, которая генерирует адаптеры LoRA из изображений за один проход

Оставить комментарий