Динамическая память Memp для ИИ-агентов снижает затраты

Новый фреймворк Memp от исследователей Zhejiang University и Alibaba добавляет ИИ-агентам динамическую процедурную память, позволяя им учиться на опыте и сокращать затраты на выполнение сложных задач.

Оглавление

Проблема текущих ИИ-агентов
Архитектура Memp
Практическая реализация и результаты
Будущее автономных агентов

Исследователи из Zhejiang University и Alibaba Group разработали революционный метод, который наделяет ИИ-агентов динамической процедурной памятью. Технология Memp позволяет системам накапливать опыт и становиться эффективнее с каждой новой задачей, что кардинально меняет подход к автоматизации сложных бизнес-процессов.

Проблема текущих ИИ-агентов

Современные агенты на основе больших языковых моделей демонстрируют впечатляющие возможности, но остаются крайне уязвимыми в реальных условиях. Сетевые сбои, изменения интерфейсов или модификации структур данных могут полностью нарушить выполнение многоэтапных процессов.

Как отмечают разработчики, текущие системы лишены возможности извлекать уроки из прошлого опыта и вынуждены каждый раз начинать с нуля.

Ключевая проблема заключается в отсутствии процедурной памяти — того самого механизма, который позволяет людям автоматизировать навыки вроде печати или езды на велосипебе. Существующие решения либо полагаются на жестко заданные разработчиками шаблоны, либо хранят знания в параметрах модели, что делает их обновление дорогим и медленным.

Сравнение создания с нуля и использования процедурной памяти в ИИ-агентах

Архитектура Memp

Фреймворк Memp построен вокруг трех непрерывно работающих компонентов:

Построение памяти — преобразование опыта агента в два формата: дословные последовательности действий или абстрактные сценарии высокого уровня
Поиск в памяти — использование векторного поиска и ключевых слов для нахождения релевантного прошлого опыта
Обновление памяти — наиболее критичный компонент, обеспечивающий эволюцию знаний через добавление нового опыта, фильтрацию успешных результатов и коррекцию ошибок

В отличие от Mem0 и A-MEM, которые фокусируются на запоминании содержания внутри одной сессии, Memp специализируется на межсессионной процедурной памяти — именно том «как-знании», которое можно обобщать across similar tasks.

Архитектура фреймворка Memp: создание, поиск и обновление памяти

Практическая реализация и результаты

Команда успешно протестировала Memp на моделях GPT-4o, Claude 3.5 Sonnet и Qwen2.5 в различных сценариях, включая домашние задачи в ALFWorld и планирование путешествий. Результаты показали:

Значительное повышение успешности выполнения задач
Сокращение количества шагов и потребления токенов
Устранение бесполезного перебора вариантов

Наиболее впечатляющим оказался эффект переноса знаний: процедурная память, сгенерированная мощной GPT-4o, будучи переданной меньшей модели Qwen2.5-14B, существенно улучшила её показатели. Это открывает путь к cost-effective развертыванию — обучение на дорогих моделях с последующим использованием на экономичных.

Сравнение производительности: сокращение шагов и потребления токенов с процедурной памятью

Будущее автономных агентов

Memp решает фундаментальную проблему «холодного старта» через введение метрик оценки вместо требования идеальных примеров. Разработчики могут определить основанную на правилах или LLM-метрику качества, позволив моделям исследовать пространство задач и сохранять наиболее успешные траектории.

Этот подход кардинально меняет экономику ИИ-агентов: вместо ручного программирования каждого сценария мы получаем самообучающиеся системы, которые становятся лучше с практикой — как и люди.

Технология Memp представляет собой плавный шаг к созданию по-настоящему автономных агентов, способных непрерывно улучшать наши процедурные знания в существующих условиях. По сообщению VentureBeat, эта платформа уже впечатляет результатами в снижении затрат и сложности автоматизации предприятия.

Новости

Технология динамической памяти Memp поможет сократить затраты на ИИ-агентов

Проблема текущих ИИ-агентов

Архитектура Memp

Практическая реализация и результаты

Будущее автономных агентов

Еще интереснее

Оптическое распознавание текста вышло на новый уровень с открытыми моделями

Google Cloud представила трекинг данных на уровне отдельных столбцов для BigQuery

Amazon SageMaker Canvas теперь поддерживает бессерверное развертывание моделей

MIT и IBM создают ИИ с реальной ценностью для бизнеса и общества

Оставить комментарий