Оглавление
Финансовые рынки постоянно реагируют на новую информацию: новостные события, политические заявления и экономические данные вызывают изменения цен. Большинство NLP-моделей способны классифицировать новости как позитивные или негативные, или даже предсказывать численную доходность, но они работают как черные ящики: не объясняют, почему сделан тот или иной прогноз.
Методология: два подхода к прозрачности
В исследовании рассматривается комбинация двух методов:
- GRPO (Group Relative Policy Optimization) — обучение с подкреплением для оптимизации прогнозов
- RAG (Retrieval-Augmented Generation) — извлечение исторических финансовых событий для улучшения рассуждений
Это сочетание позволяет создавать модели, которые одновременно прогнозируют и объясняют свои решения.
Обучение с GRPO
GRPO вводит функцию вознаграждения для управления моделью:
- +4 балла если правильно предсказаны и акция, и направление движения
- +2 балла если правильно предсказан только один параметр
- 0 баллов в остальных случаях
Модель получает событие на вход и должна выдать:
- Выбранную акцию
- Прогноз цены
- Объяснение
Для обучения использовался датасет FinancialClassification
Добавление RAG для контекста
Для улучшения рассуждений интегрированы исторические прецеденты. Контекст извлекается из векторной базы данных FAISS, содержащей прошлые новости и выступления центральных банков.
Извлеченная информация добавляется во входной промпт. Использован датасет: FinancialNewsAndCentralBanksSpeeches-Summary-Rag
Пример промпта (с RAG):
Вы — финансовый аналитик рынка.
Перед тем как сделать прогноз, вы всегда анализируете прошлое, которое дано в Контексте ниже.
Ответьте на Вопрос на основе того, что происходило в прошлом.
Пожалуйста, ответьте с:
- Выбранная акция: (название)
- Прогноз: (изменение цены)
- Объяснение: (кратко и понятно)
Контекст: {context}
Вопрос: {question}
Объяснимость в финансовых AI-моделях — это не просто академическое упражнение. Регуляторы все чаще требуют прозрачности алгоритмов, принимающих инвестиционные решения. Комбинация обучения с подкреплением с retrieval-подходом — элегантное решение, но остается вопрос: насколько исторические прецеденты действительно релевантны в условиях быстро меняющихся рынков? Ведь прошлые кризисы редко повторяются в точности.
Результаты и перспективы
По сравнению с FinBERT и стандартными классификаторами, этот подход дает результаты, которые одновременно точны и интерпретируемы. Модель не только предсказывает изменения цен на акции, но и объясняет почему, с ответами, основанными на прошлых событиях. Попробовать модель можно в пространстве StockPredictionExplanation
По материалам Hugging Face.
Оставить комментарий