Современные системы искусственного интеллекта постепенно превращаются из простых чат-ботов в сложные многошаговые механизмы, которые исследователи называют агентными ворклоудами. Однако за внешней эффективностью скрывается серьезная проблема избыточного потребления ресурсов, которую попытались решить специалисты MIT и Microsoft. Как сообщает MIT News, представленная ими система Murakkab позволяет автоматизировать проектирование и развертывание таких цепочек, значительно снижая затраты на облачные вычисления.
Проблема фрагментированности агентных систем сегодня стоит особенно остро, так как разработчикам приходится вручную связывать различные модели и инструменты, что неизбежно ведет к неоптимальному распределению мощностей. Murakkab, получившая название от урдуского слова, означающего «композиция», берет на себя роль интеллектуального оркестратора. Она анализирует высокоуровневое описание задачи и самостоятельно подбирает наиболее подходящие компоненты, балансируя между скоростью работы и итоговой стоимостью.
Автоматизация против ручного конфигурирования
Традиционный подход к созданию сложных ИИ-приложений требует от инженера жестко фиксировать выбор каждой модели и аппаратного обеспечения еще на этапе проектирования. В условиях, когда новые ускорители и LLM появляются едва ли не каждую неделю, такая архитектура быстро становится устаревшей и дорогой в обслуживании. Murakkab решает эту дилемму, принимая решения о конфигурации динамически, что позволяет интегрировать новые технологии без необходимости переписывать код с нуля.
Система не просто выбирает инструменты, но и определяет оптимальный порядок их выполнения, выявляя процессы, которые можно запустить параллельно. Для облачных провайдеров это открывает возможность видеть структуру нагрузки «изнутри», что позволяет более эффективно разделять ресурсы между разными пользователями. В ходе тестов на задачах по генерации кода и анализу видео система продемонстрировала впечатляющие результаты, используя лишь 35% вычислительных мощностей по сравнению со стандартными методами.
Перекладывание ответственности за архитектуру на автоматику — логичный шаг, учитывая избыточную сложность современных стеков. Murakkab эффективно устраняет оверхед при вызове множества API, но успех системы в реальном продакшене будет зависеть от готовности вендоров раскрывать параметры своих закрытых моделей. Без прозрачности со стороны поставщиков проприетарного софта любая динамическая оптимизация рискует столкнуться с «черным ящиком», превращая экономию в лотерею.
Баланс между точностью и экологичностью
Особое внимание авторы работы уделили вопросам устойчивого развития и энергопотребления, которые становятся критическими для дата-центров. Испытания показали, что Murakkab способна сократить потребление энергии на 73%, при этом финансовые затраты снижаются более чем в четыре раза. В одном из сценариев системе удалось снизить энергозатраты на порядок, пожертвовав лишь двумя процентами точности ответов, что является приемлемым компромиссом для большинства бизнес-задач.
Разработчики из MIT планируют масштабировать свое решение для работы с еще более крупными вычислительными кластерами и сложными сценариями. Пока индустрия продолжает гонку за параметрами моделей, подобные инструменты оптимизации напоминают, что эффективность кода и разумное управление «железом» все еще имеют значение. Возможно, именно такие невидимые глазу системы оркестрации станут тем фундаментом, который сделает массовое внедрение автономных агентов экономически оправданным.
Оставить комментарий