Системный промпт GPT-5 появился на GitHub, обнажив внутренние инструкции OpenAI для флагманской модели. Утечка раскрывает механику ограничений — от запрета на генерацию защищённого контента до жёстких рамок работы с персональными данными.
Что запрещено ИИ
OpenAI явно учится на ошибках: промпт категорически запрещает воспроизводить тексты песен или защищённый копирайтом материал даже по запросу. Но главное — жёсткие фильтры на запоминание «чувствительных» данных:
- Раса, религия или этническая принадлежность
- Судимости и точные геолокации
- Политические взгляды и членство в профсоюзах
- Медицинские диагнозы и сексуальная ориентация
Как отмечается в инструкции: «Избегай излишне личных деталей, которые могут вызвать ощущение слежки».
Гонка за актуальностью
GPT-5 получил мандат на агрессивное использование веб-поиска. Система должна оценивать «потребность в свежести» запроса по шкале 0-5 и автоматически искать данные для:
- Нишевых или быстро меняющихся тем
- Финансовых/медицинских/юридических вопросов
- Любых высокорисковых контекстов
Прямое указание: «Всегда перепроверяй информацию по нескольким авторитетным источникам» — ответ на частые ошибки GPT-4o в базовых фактах.
Инструменты и память
Новый функционал превращает GPT-5 в персонального ассистента:
- Долгосрочная память («био») о пользователе
- Планировщик напоминаний и автоматических поисков
- Рабочее пространство (canvas) для совместного редактирования кода и документов
- Расширенные возможности работы с файлами и изображениями
Парадокс: при строгих ограничениях на сбор данных, система обязана запоминать любую информацию по явному указанию пользователя: «Всегда вызывай инструмент bio, если запрошено сохранение или удаление данных».
Утечка системного промпта — это как разобрать часы, чтобы увидеть пружины. OpenAI не просто добавляет «безопасность поверх» — они вшивают ограничения в ДНК модели. Ирония в том, что запрет на запоминание пола/расы/религии легко обходится явным указанием пользователя — это не защита приватности, а юридический щит. Агрессивный веб-поиск — попытка закрыть позорные лаги в актуальности, но главный риск в другом: представьте, что промпт научатся джейлбрейкать так же легко, как читать. Тогда все эти запреты станут декорацией.
Оставить комментарий