HyFiD: Использование LLM для детекции пожаров в метро

Исследователи разработали систему HyFiD, которая объединяет семантический анализ LLM и классические алгоритмы для точного обнаружения возгораний в метро.

Оглавление

Архитектура HyFiD: от цифр к смыслам
Проблема прямого использования промптов

Обеспечение безопасности в тоннелях метрополитена всегда было задачей со звездочкой из-за сложной аэродинамики и работы систем вентиляции, которые часто сбивают с толку классические датчики. Группа исследователей из Южной Кореи представила проект HyFiD — гибридный фреймворк, который использует возможности больших языковых моделей для качественного улучшения работы систем раннего обнаружения возгораний.

Как сообщает издание Nature, ключевая проблема существующих методов машинного обучения заключается в отсутствии контекстуального понимания. Когда мощные потоки воздуха от систем кондиционирования размывают концентрацию газов или нарушают температурное расслоение, обычные алгоритмы могут принять опасную ситуацию за норму или, наоборот, поднять ложную тревогу. Именно здесь на помощь приходят семантические возможности современных нейросетей.

Архитектура HyFiD: от цифр к смыслам

Разработанная система не заменяет классические классификаторы языковыми моделями, а использует их в качестве продвинутого инструмента извлечения признаков. Процесс обработки данных выглядит следующим образом:

Сбор показаний с мультисенсорных панелей, фиксирующих температуру, уровень задымления, а также концентрацию O2, CO и CO2.
Преобразование числовых данных в текстовое описание текущего состояния среды с помощью LLM.
Генерация семантических векторов на основе текстовых оценок.
Слияние полученных векторов с исходными числовыми данными для финального обучения классификатора на базе GBM (Gradient Boosting Machine).

В ходе экспериментов, моделирующих сценарии в Fire Dynamics Simulator, включая возгорания литиевых батарей и работу HVAC-систем, конфигурация на базе GBM показала лучшие результаты по точности и полноте обнаружения. Исследователи подчеркивают, что использование LLM как промежуточного звена для создания «смысловых портретов» ситуации гораздо эффективнее, чем попытки заставить модель принимать окончательное решение напрямую через промпты.

Идея делегировать LLM роль интерпретатора физических аномалий выглядит изящным костылем для преодоления «узких мест» классического машинного обучения. Однако интеграция тяжеловесных трансформеров в системы реального времени неизбежно упрется в задержки инференса, которые в условиях пожара критичнее любой точности. Пока это впечатляющий академический концепт, требующий жесткой оптимизации для работы на периферийных устройствах.

Проблема прямого использования промптов

Анализ показал, что попытки использовать такие модели, как Llama-3-8B или Qwen-2.5-7B, в качестве самостоятельных судей дают нестабильные результаты. При использовании метода Zero-shot CoT (цепочка рассуждений без примеров) многие модели демонстрировали практически нулевую способность корректно классифицировать пожар на основе одних лишь «голых» цифр сенсоров.

Даже продвинутые стратегии, такие как Few-shot CoT, хотя и улучшили показатели Llama-3-8B до 70,32% по метрике F1, все равно значительно уступили гибридному подходу. Комбинация классического алгоритма и семантического анализатора достигла отметки в 90,77%, что подтверждает тезис: нейросети лучше справляются с описанием контекста, чем с сухой математической логикой в критических сценариях.

Кроме того, операционное поведение системы оценивалось не только по точности, но и по скорости срабатывания. Оказалось, что правильная настройка временного окна (около 1-2 секунд) позволяет существенно снизить количество преждевременных тревог, сохраняя при этом высокую чувствительность к реальным угрозам. Это лишний раз доказывает, что в вопросах безопасности инженерная прагматика должна превалировать над чистым энтузиазмом в области ИИ.