Оглавление

Исследователи Microsoft выявили фундаментальную проблему взаимодействия AI-агентов в быстрорастущей экосистеме Model Context Protocol, сообщает Microsoft Research.

Проблема горизонтальной интеграции

2025 год стал временем прорыва в области агентного ИИ — системы теперь способны проводить глубокие исследования, управлять компьютерами, выполнять сложные инженерные задачи и решать многоэтапные проблемы. Однако до сих пор индустрия полагалась на вертикальную интеграцию: инструменты и агенты совместно проектировались, тренировались и тестировались для максимальной производительности.

С распространением Model Context Protocol (MCP) ситуация изменилась. Экосистема выросла из перспективной спецификации в процветающий рынок инструментов:

  • Zapier предлагает каталог из 30,000 инструментов в 7,000 сервисах
  • Composio предоставляет более 100 управляемых MCP-серверов
  • Hugging Face обслуживает множество Spaces-приложений через MCP
  • Shopify подключил MCP для миллионов онлайн-магазинов

Что такое интерференция инструментов

Интерференция инструментов описывает ситуации, когда в остальном разумные инструменты или агенты, будучи совместно представленными, снижают общую эффективность системы. Это может выражаться в:

  • Удлинении последовательностей действий
  • Увеличении токенных затрат
  • Хрупком восстановлении после ошибок
  • Полном провале задачи

Практический пример с Magentic-One

Рассмотрим расширение возможностей Magentic-One — мультиагентной системы для решения сложных задач. Система включает агентов для написания кода, работы с терминалом, веб-серфинга и доступа к файлам. При добавлении агента с GitHub MCP Server возникает проблема выбора: использовать браузер, терминал или MCP-сервер? Состояния начинают расходиться: смена ветки в браузере не меняет ветку в терминале, авторизация в MCP не означает авторизацию в браузере.

Диаграмма архитектуры Magentic-One с оркестратором и суб-агентами для кода, терминала, веба и файлов

Проблема интерференции инструментов — это классическая дилемма совместимости в новой обертке. Разработчики MCP-серверов работают в вакууме, не зная, с какими другими инструментами придется сосуществовать их детищам. Результат предсказуем: агенты начинают бороться за ресурсы, путаться в состояниях и в лучшем случае удлиняют цепочки действий, а в худшем — полностью проваливают задачи. Ирония в том, что чем богаче становится экосистема MCP, тем острее проявляется эта проблема.

Масштабное исследование MCP-экосистемы

Microsoft провела анализ MCP-серверов из двух реестров: smithery.ai и Docker MCP Hub. После исключения пустых и неудачных серверов в каталоге осталось 1,470 серверов.

Для автоматизированного анализа исследователи разработали MCP Interviewer — инструмент, который:

  1. Каталогизирует инструменты, промпты, ресурсы и возможности сервера
  2. Создает план функционального тестирования с использованием LLM (GPT-4.1)
  3. Оценивает качественные критерии через специальные рубрики

Инструмент уже доступен как инструмент с открытым исходным кодом (CLI).

Ключевые выводы исследования

Главная проблема: MCP-серверы не знают, с какими клиентами или моделями они работают, и представляют один общий набор инструментов всем. Однако разные модели по-разному справляются с длинными контекстами и большими пространствами инструментов.

OpenAI рекомендует разработчикам ограничиваться 20 функциями для высокой точности, хотя технический лимит составляет 128 инструментов. Большие пространства инструментов могут снижать производительность некоторых моделей до 85%.