Оглавление

Финансовые рынки постоянно реагируют на новую информацию: новостные события, политические заявления и экономические данные вызывают изменения цен. Большинство NLP-моделей способны классифицировать новости как позитивные или негативные, или даже предсказывать численную доходность, но они работают как черные ящики: не объясняют, почему сделан тот или иной прогноз.

Методология: два подхода к прозрачности

В исследовании рассматривается комбинация двух методов:

  • GRPO (Group Relative Policy Optimization) — обучение с подкреплением для оптимизации прогнозов
  • RAG (Retrieval-Augmented Generation) — извлечение исторических финансовых событий для улучшения рассуждений

Это сочетание позволяет создавать модели, которые одновременно прогнозируют и объясняют свои решения.

Обучение с GRPO

GRPO вводит функцию вознаграждения для управления моделью:

  • +4 балла если правильно предсказаны и акция, и направление движения
  • +2 балла если правильно предсказан только один параметр
  • 0 баллов в остальных случаях

Модель получает событие на вход и должна выдать:

  • Выбранную акцию
  • Прогноз цены
  • Объяснение

Для обучения использовался датасет FinancialClassification

Добавление RAG для контекста

Для улучшения рассуждений интегрированы исторические прецеденты. Контекст извлекается из векторной базы данных FAISS, содержащей прошлые новости и выступления центральных банков.

Извлеченная информация добавляется во входной промпт. Использован датасет: FinancialNewsAndCentralBanksSpeeches-Summary-Rag

Пример промпта (с RAG):

Вы — финансовый аналитик рынка.
Перед тем как сделать прогноз, вы всегда анализируете прошлое, которое дано в Контексте ниже.

Ответьте на Вопрос на основе того, что происходило в прошлом.

Пожалуйста, ответьте с:
- Выбранная акция: (название)
- Прогноз: (изменение цены)
- Объяснение: (кратко и понятно)

Контекст: {context}
Вопрос: {question}

Объяснимость в финансовых AI-моделях — это не просто академическое упражнение. Регуляторы все чаще требуют прозрачности алгоритмов, принимающих инвестиционные решения. Комбинация обучения с подкреплением с retrieval-подходом — элегантное решение, но остается вопрос: насколько исторические прецеденты действительно релевантны в условиях быстро меняющихся рынков? Ведь прошлые кризисы редко повторяются в точности.

Результаты и перспективы

По сравнению с FinBERT и стандартными классификаторами, этот подход дает результаты, которые одновременно точны и интерпретируемы. Модель не только предсказывает изменения цен на акции, но и объясняет почему, с ответами, основанными на прошлых событиях. Попробовать модель можно в пространстве StockPredictionExplanation

По материалам Hugging Face.