Оглавление
По сообщению OpenAI, Notion полностью пересмотрел подход к интеграции искусственного интеллекта в свою платформу, отказавшись от точечных улучшений в пользу архитектуры, ориентированной на автономных агентов.
От точечных функций к автономным рабочим процессам
В 2022 году Notion быстро внедрил GPT-4 для создания ассистента письма и поисковых функций. Однако по мере развития моделей команда осознала ограничения существующего подхода. Изолированные задачи сменяются полноценными рабочими процессами, где агенты должны принимать решения, оркестрировать инструменты и работать с неопределенностью.
«Мы не хотели адаптировать систему. Нам нужна была архитектура, которая действительно поддерживает работу моделей рассуждения», — отмечает Сара Сакс, руководитель отдела AI-моделирования в Notion.
Архитектура для рассуждающих моделей
Вместо доработок существующего стека Notion полностью перестроил систему. Цепочки промптов для конкретных задач заменили центральной моделью рассуждений, координирующей модульных суб-агентов. Эти агенты могут искать информацию в Notion, Slack или интернете, добавлять и редактировать базы данных, синтезировать ответы с использованием необходимых инструментов.
С запуском Notion 3.0 ИИ не просто встроен в рабочие процессы — он может их выполнять. Пользователи назначают широкую задачу, например, сбор отзывов заинтересованных сторон, и агент планирует, выполняет и отчитывается о результате.
Тестирование GPT-5 на реальных задачах
Для проверки архитектурных изменений Notion оценил GPT-5 против других современных моделей на реальных пользовательских задачах. Оценки основывались на обратной связи, которую компания уже отметила как высокоприоритетную, включая вопросы из режима исследований, многоэтапные задачи и работу с устаревшим контентом.
Команда использовала комбинацию LLM-как-судьи, структурированные тесты и человеческую обратную связь.
Ключевые результаты:
- Улучшение на 7,6% по сравнению с современными моделями по соответствию реальным пользовательским ожиданиям
- На 15% лучше работа со сложными исследовательскими вопросами
- Более чем 100% улучшение в многоэтапных структурированных задачах
- Единственная модель, полностью насыщающая бенчмарки с противоречивыми или устаревшими данными
«Мы не выбирали задачи выборочно. Это были высокозначимые рабочие процессы из нашего продукта», — говорит Сакс. «Именно здесь различия моделей действительно проявляются».
Дизайн для результата, а не скорости
Notion разработал агентов, которые работают от секунд до минут в зависимости от задачи. Короткая задержка приоритетна для прямых запросов. Долгоработающие агенты — до 20 минут — используются для фоновых процессов вроде суммирования контента или обновления баз данных.
Команду волнует, сколько времени возвращается пользователю, а не как быстро отвечает модель. Эта философия определяет подход к оркестровке и настройке ожиданий в интерфейсе.
Использование Notion для создания Notion AI
Каждая команда Notion использует Notion AI. Это ежедневное использование генерирует структурированную обратную связь и прямую аннотацию от людей, когда что-то идет не так. Если пользователь оценивает результат негативно, он попадает в конвейер для отладки на уровне трассировки.
Но внутреннего использования было недостаточно. Команда также работала с партнерами по дизайну — техническими клиентами с ранним доступом к функциям агентов — чтобы выявить крайние случаи и обнаружить слепые зоны.
Это внешнее тестирование помогло сформировать готовность продукта, настроить поведение оркестровки и подтвердить, где GPT-5 действительно имеет значение. OpenAI также использует Notion для координации проектов и знаний, с интегрированным Notion AI в ежедневных рабочих процессах для ускорения проверок и закрытия обратной связи.
Уроки для команд, работающих с GPT-5
Перестройка Notion была не только о запуске Notion 3.0. Речь шла о проектировании системы, способной поддерживать новые возможности моделей и адаптироваться по мере их развития. Их подход предлагает четкую дорожную карту для других команд, внедряющих агентный ИИ в продакшене:
- Оценивайте то, что важно. Используйте задачи, которые ваши пользователи действительно выполняют, а не синтетические бенчмарки.
- Тестируйте сложные вещи. GPT-5 сияет, когда информация неоднозначна, устарела или требует многоэтапной обработки.
- Архитектура для автономности. Если агенты принимают решения, ваша система должна давать им пространство для рассуждений и инструменты для действий.
- Ясность определяет производительность. Даже лучшие модели не справляются без чистых описаний инструментов и хорошего дизайна интерфейса.
- Перестройка лучше доработок. Если ваша система создавалась для моделей завершения, она может не масштабироваться до агентов.
«Мы уже видим отдачу от перестройки», — говорит Сакс. «Если следующая модель откроет что-то новое, мы сделаем все необходимое для ее поддержки».
Интересно наблюдать, как компании переходят от точечного использования ИИ к полноценным агентным системам. Notion демонстрирует классическую эволюцию: сначала все довольны простыми помощниками, потом понимают, что настоящая ценность — в автономных рабочих процессах. GPT-5 явно дает качественный скачок в способности моделей рассуждать и действовать в условиях неопределенности, но ключевой урок здесь — архитектурный. Без правильной системы даже самая продвинутая модель остается просто умным чат-ботом.
Оставить комментарий