Оглавление

Традиционный подход к оптимизации нейросетей долгое время опирался на интуицию разработчиков, которые вручную прописывали правила поведения моделей при выполнении сложных задач. Однако совместная исследовательская группа из ведущих университетов США и технологических гигантов, включая Google и Meta, решила передать эту роль искусственному интеллекту, заставив кодинг-агента искать более эффективные пути управления вычислениями.

Как сообщает The Decoder, в рамках проекта AutoTTS ученые отказались от написания жестких инструкций для масштабирования во время инференса (test-time scaling). Вместо этого они создали среду, где агент Claude Code самостоятельно проектировал алгоритмы управления, анализируя тысячи вариантов в поисках идеального баланса между точностью ответов и затратами ресурсов.

Симуляция как способ сэкономить миллионы

Одной из главных проблем при поиске новых алгоритмов всегда была стоимость: запуск мощных моделей для каждой проверки — удовольствие не из дешевых. Исследователи обошли это препятствие, создав офлайн-окружение, где агент оперирует уже сгенерированными данными. Это позволило протестировать тысячи итераций управления без необходимости каждый раз обращаться к дорогостоящим мощностям LLM.

Процесс поиска выглядел как серия циклов, где Claude Code изучал логи прошлых запусков, видел, на каких этапах вычисления тратились впустую, и корректировал программный код контроллера. Важной деталью стало ограничение: агент должен был выдавать один высокоуровневый интерфейс, который сам управляет внутренними порогами и параметрами, не перегружая систему избыточными настройками.

Логика, ускользающая от человека

Результаты работы AutoTTS оказались не просто эффективными, но и в некотором смысле странными для человеческого понимания. Вместо того чтобы просто увеличивать количество попыток при неудачах, созданный агентом алгоритм начал отслеживать динамику уверенности модели в реальном времени. Если уверенность растет быстро, система экономит ресурсы; если колеблется — открывает новые пути решения.

На математических тестах AIME и HMMT новый алгоритм показал ту же точность, что и классические методы, но при этом снизил потребление токенов на внушительные 70%. Любопытно, что найденная стратегия успешно перенеслась на совершенно другие архитектуры, такие как DeepSeek-R1-Distill-Llama-8B, доказав свою универсальность вне зависимости от конкретной модели.

Перекладывание дизайна алгоритмов на плечи ИИ — шаг логичный, но обнажающий нашу неспособность полностью контролировать логику принятия решений. Мы получаем впечатляющий прирост эффективности при 70-процентной экономии, однако архитектура управления становится «черным ящиком», где человеческий фактор заменяется программной интуицией агента. Если мы не понимаем, почему алгоритм выбрал именно этот путь, любая ошибка в краевых условиях может привести к непредсказуемому каскадному отказу всей системы. Эффективность куплена ценой прозрачности.

От написания кода к проектированию пространств

Этот эксперимент знаменует собой важный сдвиг в роли инженера: теперь человек не изобретает правила, а проектирует пространство поиска, в котором эти правила рождаются. Работа AutoTTS встает в один ряд с такими проектами, как FunSearch от Google DeepMind, подтверждая тренд на автономную эволюцию алгоритмов. Весь процесс открытия новой стратегии занял всего 160 минут и стоил около 40 долларов.

Несмотря на успех, у технологии остаются белые пятна. Текущая версия AutoTTS ограничена балансом «ширины и глубины» поиска и пока не умеет строить сложные древовидные структуры. Тем не менее, прецедент создан: когда дело доходит до тонкой настройки вычислительных процессов, алгоритм, написанный другим алгоритмом, оказывается прозорливее своего создателя-человека.