Оглавление
Исследователи Microsoft выявили фундаментальную проблему взаимодействия AI-агентов в быстрорастущей экосистеме Model Context Protocol, сообщает Microsoft Research.
Проблема горизонтальной интеграции
2025 год стал временем прорыва в области агентного ИИ — системы теперь способны проводить глубокие исследования, управлять компьютерами, выполнять сложные инженерные задачи и решать многоэтапные проблемы. Однако до сих пор индустрия полагалась на вертикальную интеграцию: инструменты и агенты совместно проектировались, тренировались и тестировались для максимальной производительности.
С распространением Model Context Protocol (MCP) ситуация изменилась. Экосистема выросла из перспективной спецификации в процветающий рынок инструментов:
- Zapier предлагает каталог из 30,000 инструментов в 7,000 сервисах
- Composio предоставляет более 100 управляемых MCP-серверов
- Hugging Face обслуживает множество Spaces-приложений через MCP
- Shopify подключил MCP для миллионов онлайн-магазинов
Что такое интерференция инструментов
Интерференция инструментов описывает ситуации, когда в остальном разумные инструменты или агенты, будучи совместно представленными, снижают общую эффективность системы. Это может выражаться в:
- Удлинении последовательностей действий
- Увеличении токенных затрат
- Хрупком восстановлении после ошибок
- Полном провале задачи
Практический пример с Magentic-One
Рассмотрим расширение возможностей Magentic-One — мультиагентной системы для решения сложных задач. Система включает агентов для написания кода, работы с терминалом, веб-серфинга и доступа к файлам. При добавлении агента с GitHub MCP Server возникает проблема выбора: использовать браузер, терминал или MCP-сервер? Состояния начинают расходиться: смена ветки в браузере не меняет ветку в терминале, авторизация в MCP не означает авторизацию в браузере.

Проблема интерференции инструментов — это классическая дилемма совместимости в новой обертке. Разработчики MCP-серверов работают в вакууме, не зная, с какими другими инструментами придется сосуществовать их детищам. Результат предсказуем: агенты начинают бороться за ресурсы, путаться в состояниях и в лучшем случае удлиняют цепочки действий, а в худшем — полностью проваливают задачи. Ирония в том, что чем богаче становится экосистема MCP, тем острее проявляется эта проблема.
Масштабное исследование MCP-экосистемы
Microsoft провела анализ MCP-серверов из двух реестров: smithery.ai и Docker MCP Hub. После исключения пустых и неудачных серверов в каталоге осталось 1,470 серверов.
Для автоматизированного анализа исследователи разработали MCP Interviewer — инструмент, который:
- Каталогизирует инструменты, промпты, ресурсы и возможности сервера
- Создает план функционального тестирования с использованием LLM (GPT-4.1)
- Оценивает качественные критерии через специальные рубрики
Инструмент уже доступен как инструмент с открытым исходным кодом (CLI).
Ключевые выводы исследования
Главная проблема: MCP-серверы не знают, с какими клиентами или моделями они работают, и представляют один общий набор инструментов всем. Однако разные модели по-разному справляются с длинными контекстами и большими пространствами инструментов.
OpenAI рекомендует разработчикам ограничиваться 20 функциями для высокой точности, хотя технический лимит составляет 128 инструментов. Большие пространства инструментов могут снижать производительность некоторых моделей до 85%.
Оставить комментарий