Оглавление

Компания Microsoft Research представила открытый фреймворк Promptions, призванный положить конец бесконечному угадыванию «правильных» промптов для языковых моделей. Вместо того чтобы вновь и вновь переформулировать запрос, пользователь получает динамический набор элементов управления интерфейсом, которые адаптируются к контексту задачи и позволяют тонко настраивать ответ ИИ. Фреймворк доступен под лицензией MIT на Microsoft Foundry Labs и GitHub, сообщает Microsoft Research.

Проблема: промпт-инженерия как искусство угадывания

Опыт работы с современными языковыми моделями часто сводится к мучительному циклу проб и ошибок. Пользователь формулирует запрос, получает не совсем тот ответ, который ожидал, и начинает подбирать слова заново. Особенно это заметно в задачах на понимание — объяснение сложной формулы, концепции или кода. Один и тот же предмет запроса может требовать принципиально разных объяснений: краткий синтаксис для опытного разработчика, пошаговое руководство по отладке или педагогическое объяснение для коллег.

Исследователи из Microsoft в своей работе «Dynamic Prompt Middleware» выявили, что пользователи тратят непропорционально много времени не на усвоение материала, а на управление самим взаимодействием с ИИ. Связь между естественным языком и поведением системы часто непрозрачна, что делает результат непредсказуемым.

Для эффективного использования инструмента, призванного упростить понимание, требуется развивать отдельный навык — промпт-инженерию. Это похоже на необходимость изучать санскрит, чтобы прочитать инструкцию к микроволновке. Promptions — это попытка вернуть фокус с формы запроса на его суть, предоставив пользователю понятные «ручки» для настройки.

Решение: от статики к динамике

В основе Promptions лежат результаты двух исследований с участием 54 специалистов из технических и нетехнических областей. Первое исследование с 38 профессионалами выявило полезность статических опций уточнения (длина, тон, формат начала ответа), но также их главный недостаток — они не адаптировались к конкретному контенту запроса (формуле, фрагменту кода).

Второе, контролируемое исследование с 16 техническими специалистами, сравнило две системы: статическую (Static PRC) и динамическую (Dynamic PRC). Динамическая система автоматически генерировала опции уточнения на основе ввода пользователя в реальном времени.

Как работает динамическое уточнение

Процесс взаимодействия с Dynamic PRC, описанный в исследовании, выглядит так:

  1. Пользователь просит объяснить, например, длинную формулу Excel.
  2. Система динамически генерирует наборы опций для уточнения: «Уровень детализации объяснения», «Ключевые области», «Цели обучения».
  3. Пользователь корректирует эти параметры с помощью ползунков, выпадающих списков и других элементов UI.
  4. ИИ возвращает объяснение, соответствующее выбранным настройкам.
  5. При необходимости пользователь может добавить новый запрос на управление структурой ответа.
  6. На основе этого система генерирует новые наборы опций.
  7. ИИ выдает обновленное объяснение.
Диаграмма взаимодействия системы Dynamic PRC: запрос, варианты ответа, правки пользователя и итоговый ответ ИИ

Источник: www.microsoft.com

Диаграмма размаха, сравнивающая согласие пользователей с утверждениями об эффективности контроля для динамического и статического PRC

Источник: www.microsoft.com

Результаты: контроль, исследование, рефлексия

Участники исследования единогласно отметили, что динамические элементы управления значительно упростили выражение нюансов задачи. Потребность в многократном перефразировании промптов сократилась, что позволило сфокусироваться на содержании, а не на механике формулировок.

Контекстные опции, которые пользователь, возможно, не рассмотрел бы самостоятельно, стимулировали более глубокое исследование темы. Например, параметр «Цель обучения» заставлял задуматься: нужно ли просто понять синтаксис или же научиться применять концепцию на практике.

Самое ценное в этом подходе — не просто экономия времени, а сдвиг в ментальной модели пользователя. Promptions превращает диалог с «черным ящиком» в структурированный процесс настройки. Это шаг к тому, чтобы ИИ-ассистенты стали предсказуемыми и надежными инструментами, а не источником случайных озарений или разочарований. Вопрос теперь не в том, «как правильно спросить», а в том, «какой именно ответ мне нужен».

Статический интерфейс PRC с выпадающими списками и переключателями для выбора уровня экспертизы, длины объяснения, роли ИИ, типа объяснения, точки старта и тона

Источник: www.microsoft.com

Диаграмма размаха, сравнивающая предпочтения пользователей по шести критериям для динамического и статического PRC

Источник: www.microsoft.com

Перспективы и открытый код

Promptions позиционируется как UI-фреймворк, который разработчики могут интегрировать в свои приложения, где требуется точный контроль над ответами ИИ: системы поддержки клиентов, образовательные платформы, медицинские консультанты. Его открытость под лицензией MIT — стратегически верный ход, позволяющий быстро создать экосистему вокруг идеи контекстно-зависимого управления промптами.

Этот подход может стать стандартом де-факто для интерфейсов, построенных поверх крупных языковых моделей, сделав взаимодействие с ними более интуитивным и эффективным для конечного пользователя, который не хочет быть промпт-инженером.