Оглавление

Мировой лидер в области светодиодного освещения Signify столкнулся с классической проблемой промышленных компаний: тысячи моделей продукции, сложные технические параметры и документация в различных форматах создавали серьёзные вызовы для системы управления знаниями. Точные и профессиональные ответы требовали времени, а автоматизация часто давала сбои.

Проблемы традиционного RAG в освещении

Хотя технология Retrieval-Augmented Generation (RAG) уже доказала свою эффективность во многих отраслях, в специфической сфере светотехники она сталкивалась с ограничениями. Мультимодальные документы, нестандартные таблицы и сложные инженерные параметры требовали постоянной кастомизации, что замедляло разработку и ограничивало масштабируемость.

Signify начала поиск более подходящих технических решений, узнав об успешном применении PIKE-RAG в таких областях, как здравоохранение и право. Компания совместно с Microsoft Research Asia запустила proof-of-concept на Microsoft Azure.

Как PIKE-RAG решает проблемы Signify

В отличие от традиционного RAG, PIKE-RAG эффективно извлекает не только текстовую информацию, но и понимает мультимодальный контент, включая графики и таблицы. Его встроенный модуль адаптации к домену быстро изучает шаблоны рассуждений, соответствующие конкретным областям, для генерации ответов, согласованных с инженерными контекстами.

Мультимодальный парсинг документов

Техническая документация Signify включает разнообразные форматы: нестандартные таблицы (например, сравнительные диаграммы диапазонов напряжения при разных токах) и принципиальные схемы (например, ограничения мощности драйверов). Традиционные системы часто не могут эффективно обработать эту информацию — либо игнорируют её, либо извлекают неорганизованные текстовые фрагменты.

PIKE-RAG интегрирует технологию Document Intelligence от Microsoft Research Asia с моделями Azure OpenAI для точного определения структур таблиц и анализа ключевых параметров в принципиальных схемах. Например, когда агент службы поддержки запрашивает: «Какое выходное напряжение у конкретной модели драйвера при токе 0,15А», система автоматически находит кривую на диаграмме в документе и определяет диапазон 40–54В на основе интервала тока — область, где традиционные системы часто ошибаются из-за неспособности «читать» диаграммы.

Многоуровневое логическое рассуждение

Традиционные системы RAG обычно следуют модели «один вопрос — один ответ» и испытывают трудности с многошаговыми рассуждениями. В области освещения Signify клиентские запросы часто включают многоуровневые ассоциации. PIKE-RAG динамически разбивает пользовательские вопросы на исполняемые подзадачи и решает их через многоуровневые рассуждения.

Например, на вопрос «Перечислите все цоколи, совместимые с лампами серии G8», если ни один документ напрямую не предоставляет ответ, рассуждение PIKE-RAG проходит следующим образом:

  1. Система определяет неявное знание. Один документ отмечает, что серии G7 и G8 имеют идентичные размеры и что все цоколи, совместимые с серией G7, также совместимы с серией G8.
  2. На основе этого система извлекает список цоколей для серии G7.
  3. Поскольку список использует сокращения, система ищет таблицу, которая сопоставляет сокращения с полными названиями, и генерирует полный список цоколей, совместимых с G8.

Благодаря этому автоматизированному многоуровневому рассуждению система предоставляет точные и полные ответы.

Блок-схема фреймворка PIKE-RAG, показывающая оркестрацию и интеграцию гетерогенной информации из множества источников и модальностей
Источник: www.microsoft.com

Рисунок 1: PIKE-RAG оркестрирует и интегрирует гетерогенную информацию в многопользовательских и мультимодальных средах.

Тестирование показало, что платформа управления знаниями на базе PIKE-RAG обеспечила значительное преимущество. Она достигла 12% улучшения производительности по сравнению с исходной системой.

Эти результаты были достигнуты без какой-либо специфической для вопросов кастомизации, только за счёт алгоритмической оптимизации, демонстрируя точное сопоставление знаний и генерацию. Поскольку система продолжает изучать и интегрировать проприетарные знания Signify, точность, как ожидается, улучшится ещё больше.

«В proof-of-concept для нашего инструмента анализа спецификаций продукции PIKE-RAG помог нам значительно улучшить производительность исходной системы. Это повысит общую удовлетворённость клиентов. В настоящее время мы оцениваем путь применения PIKE-RAG с нескольких углов, включая техническую реализацию, контроль затрат и будущую адаптируемость, и мы с нетерпением ждём углубления нашего сотрудничества с Microsoft Research Asia для стимулирования дальнейших инноваций», — сказал Хайтао Лю, руководитель Signify Research China.

Перспективы применения за пределами светотехники

Успешный тест Signify демонстрирует сильные обобщающие возможности PIKE-RAG в сложных промышленных сценариях, обеспечивая быструю кросс-доменную адаптацию. Его основные преимущества:

  • Поддержка самоэволюции и непрерывного обучения: PIKE-RAG непрерывно анализирует ошибки во взаимодействиях и использует эволюционные алгоритмы для автоматической оптимизации стратегий извлечения знаний.
  • Модульная архитектура, ориентированная на возможности: Гибкая комбинация модулей позволяет адаптировать систему к различным отраслевым требованиям.
  • Сквозной цикл знаний: Исключение зависимости от ошибочных источников данных через установление цитатных отношений между разнообразными информационными источниками.

Что особенно впечатляет в этой истории — это не абстрактное улучшение метрик, а решение реальной бизнес-проблемы. 12% роста точности в такой специфической области, как светотехника, где ошибки в технических параметрах могут стоить компаниям миллионов, — это серьёзный результат. Интересно, что традиционный RAG здесь буксует, а специализированный PIKE-RAG показывает свою эффективность. Похоже, будущее промышленного ИИ — за узкоспециализированными решениями, а не за универсальными моделями.

По сообщению Microsoft Research, технология продолжает развиваться и может найти применение в других технически сложных отраслях, где точность информации критически важна для бизнес-процессов.