Оглавление

Исследователи из Zhejiang University и Alibaba Group разработали революционный метод, который наделяет ИИ-агентов динамической процедурной памятью. Технология Memp позволяет системам накапливать опыт и становиться эффективнее с каждой новой задачей, что кардинально меняет подход к автоматизации сложных бизнес-процессов.

Проблема текущих ИИ-агентов

Современные агенты на основе больших языковых моделей демонстрируют впечатляющие возможности, но остаются крайне уязвимыми в реальных условиях. Сетевые сбои, изменения интерфейсов или модификации структур данных могут полностью нарушить выполнение многоэтапных процессов.

Как отмечают разработчики, текущие системы лишены возможности извлекать уроки из прошлого опыта и вынуждены каждый раз начинать с нуля.

Ключевая проблема заключается в отсутствии процедурной памяти — того самого механизма, который позволяет людям автоматизировать навыки вроде печати или езды на велосипебе. Существующие решения либо полагаются на жестко заданные разработчиками шаблоны, либо хранят знания в параметрах модели, что делает их обновление дорогим и медленным.

Сравнение создания с нуля и использования процедурной памяти в ИИ-агентах

Архитектура Memp

Фреймворк Memp построен вокруг трех непрерывно работающих компонентов:

  • Построение памяти — преобразование опыта агента в два формата: дословные последовательности действий или абстрактные сценарии высокого уровня
  • Поиск в памяти — использование векторного поиска и ключевых слов для нахождения релевантного прошлого опыта
  • Обновление памяти — наиболее критичный компонент, обеспечивающий эволюцию знаний через добавление нового опыта, фильтрацию успешных результатов и коррекцию ошибок

В отличие от Mem0 и A-MEM, которые фокусируются на запоминании содержания внутри одной сессии, Memp специализируется на межсессионной процедурной памяти — именно том «как-знании», которое можно обобщать across similar tasks.

Архитектура фреймворка Memp: создание, поиск и обновление памяти

Практическая реализация и результаты

Команда успешно протестировала Memp на моделях GPT-4o, Claude 3.5 Sonnet и Qwen2.5 в различных сценариях, включая домашние задачи в ALFWorld и планирование путешествий. Результаты показали:

  • Значительное повышение успешности выполнения задач
  • Сокращение количества шагов и потребления токенов
  • Устранение бесполезного перебора вариантов

Наиболее впечатляющим оказался эффект переноса знаний: процедурная память, сгенерированная мощной GPT-4o, будучи переданной меньшей модели Qwen2.5-14B, существенно улучшила её показатели. Это открывает путь к cost-effective развертыванию — обучение на дорогих моделях с последующим использованием на экономичных.

Сравнение производительности: сокращение шагов и потребления токенов с процедурной памятью

Будущее автономных агентов

Memp решает фундаментальную проблему «холодного старта» через введение метрик оценки вместо требования идеальных примеров. Разработчики могут определить основанную на правилах или LLM-метрику качества, позволив моделям исследовать пространство задач и сохранять наиболее успешные траектории.

Этот подход кардинально меняет экономику ИИ-агентов: вместо ручного программирования каждого сценария мы получаем самообучающиеся системы, которые становятся лучше с практикой — как и люди.

Технология Memp представляет собой плавный шаг к созданию по-настоящему автономных агентов, способных непрерывно улучшать наши процедурные знания в существующих условиях. По сообщению VentureBeat, эта платформа уже впечатляет результатами в снижении затрат и сложности автоматизации предприятия.