AWS Machine Learning Blog пишет, что компания msg, международный поставщик решений для управления компетенциями, внедрила систему автоматической обработки кадровых данных на базе Amazon Bedrock. Решение msg.ProfileMap демонстрирует, как языковые модели меняют подход к управлению талантами в корпоративной среде.
Проблема разрозненных HR-данных
Кадровые службы традиционно работают с данными из десятков источников: реляционные базы данных, Excel-таблицы, Word-документы и PDF-файлы содержат информацию в различных форматах и с разными семантическими моделями. Один и тот же навык может называться по-разному в разных системах, что создает проблемы для анализа компетенций и планирования развития персонала.
Архитектура решения
MSG создала модульную систему, где на первом этапе происходит извлечение текста из разнородных источников, а затем — семантическая гармонизация данных.

Ядро системы использует гибридный подход: векторный семантический поиск сочетается с текстовыми методами сопоставления. Amazon Bedrock обеспечивает семантическое обогащение данных, значительно повышая точность сопоставления концепций. Обработанные данные индексируются и хранятся в Amazon OpenSearch Service и Amazon DynamoDB.

Архитектура решения спроектирована как облачное приложение с использованием Amazon Neptune, DynamoDB и Bedrock.

Результаты внедрения
Система прошла внутреннее тестирование на 2248 IT-концепциях и внешнее оценивание в рамках Ontology Alignment Evaluation Initiative 2024. Ключевые результаты:
- Точность рекомендаций по объединению концепций: 95.5%
- Сокращение ручной проверки: более 70%
- Покрытие высоковероятных рекомендаций: 60% всех входных данных
В международном бенчмарке Bio-ML система msg.ProfileMap показала лучшие результаты среди участников, работая с биомедицинскими датасетами.
Интересно наблюдать, как ИИ решает одну из самых болезненных проблем корпоративного мира — хаос в кадровой документации. 95% точности для HR-данных — это серьезное достижение, хотя в реальных условиях всегда останутся крайние случаи, где без человеческого вмешательства не обойтись. Особенно впечатляет одобрение GDPR и EU AI Act — редкий случай, когда регуляторные требования не тормозят, а стимулируют технологическое развитие.
Решение демонстрирует практическую ценность LLM не только в генеративных задачах, но и в сложных задачах семантической гармонизации данных, что открывает новые возможности для автоматизации бизнес-процессов в регулируемых отраслях.
Оставить комментарий