Оглавление

Amazon Web Services анонсировала новый сервис машинного обучения Nova, специализирующийся на точном определении и извлечении структурированной информации из документов. Решение предназначено для автоматизации обработки финансовых отчетов, юридических контрактов и технической документации.

Технические особенности платформы

Nova использует комбинацию компьютерного зрения и NLP для анализа документов с пиксельной точностью. Система способна:

  • Определять координаты значимых данных в сложных таблицах
  • Извлекать структурированную информацию из неоднородных форматов
  • Работать с многоязычными документами включая правые-левые системы письма
  • Обеспечивать конфиденциальность данных через локальную обработку

Практическое применение

В тестовых запусках Nova показала точность выше 95% для финансовых документов и 92% для юридических контрактов. Система особенно эффективна для автоматизации:

  • Обработки счетов-фактур и накладных
  • Извлечения ключевых условий из договоров
  • Анализа медицинских карт и рецептов
  • Обработки технической документации в производстве

Nova выглядит серьезным конкурентом для существующих OCR-решений, но ее реальная ценность проявится только при интеграции в сложные бизнес-процессы. AWS традиционно делает ставку на масштабируемость, но в регионах с жесткими требованиями к хранению данных локальные решения могут сохранять преимущество.

Рыночные перспективы

Рынок автоматизации обработки документов оценивается в $4.3 миллиарда и растет на 18% ежегодно. Nova позиционируется как альтернатива специализированным решениям вроде Abbyy FineReader и открытым библиотекам типа Tesseract, предлагая более глубокую интеграцию с облачной экосистемой AWS.

По материалам AWS Machine Learning Blog.