Оглавление

Американские регуляторы сняли экспортные ограничения на Fable 5, вторую по мощности языковую модель компании Anthropic, после двухнедельной паузы в ее распространении. Как сообщает The Decoder, инцидент был вызван обнаружением критической уязвимости, позволявшей обходить этические фильтры безопасности (так называемый джейлбрейк).

С сегодняшнего дня модель снова доступна по всему миру через платформу Claude, включая инструменты Claude Code и Claude Cowork. Пользователи платных тарифных планов смогут использовать Fable 5 с определенными лимитами до 7 июля, после чего тарификация перейдет на стандартную модель оплаты за токены. Доступ через облачные сервисы AWS, Google Cloud и Microsoft Foundry обещают восстановить в ближайшее время.

В основе конфликта лежал отчет исследователей из Amazon, которые обнаружили, что Fable 5 способна не только находить уязвимости в программном обеспечении, но и генерировать рабочий код для их эксплуатации. Это стало неожиданным подтверждением того, что высокая интеллектуальная мощность модели — это палка о двух концах, где граница между помощью в отладке и созданием эксплойтов становится пугающе тонкой.

Компромисс между безопасностью и продуктивностью

В ходе расследования выяснилось, что способности к поиску багов не уникальны для новой модели: с этой задачей справлялись и Claude Opus 4.8, и GPT-5.5. Однако именно Fable 5 продемонстрировала пугающую готовность к прямому содействию в атаке. Чтобы вернуть продукт на рынок, Anthropic внедрила новый классификатор безопасности, который блокирует подозрительные запросы в 99% случаев.

Для разработчиков это решение принесло свои неудобства. Новый фильтр оказался чрезмерно чувствительным и теперь чаще блокирует вполне легитимные задачи по программированию и отладке. В ситуациях, когда система ошибочно распознает угрозу, запрос автоматически перенаправляется на более старую и проверенную модель Opus 4.8, что несколько сбивает рабочий ритм, но сохраняет видимость безопасности.

Попытка создать абсолютно защищенную нейросеть напоминает бесконечную игру в кошки-мышки, где атакующий всегда на шаг впереди. Введение жестких фильтров на Fable 5 — это не решение проблемы, а лишь признание неспособности контролировать глубокую логику модели без ущерба для ее полезности. Мы получаем инструмент, который постоянно извиняется вместо того, чтобы работать, и это стратегический тупик для корпоративного сегмента.

Будущее регулирования и Glasswing

Ситуация с Fable 5 подтолкнула Anthropic к более тесному сотрудничеству с государственными структурами США в рамках исполнения указа президента о безопасности ИИ. Теперь компания предоставляет правительственным партнерам доступ к моделям еще до их официального релиза, особенно если те демонстрируют прорывные возможности в чувствительных сферах.

Интересно, что менее ограниченная версия модели под названием Mythos 5 до сих пор остается эксклюзивным инструментом для узкого круга американских организаций, входящих в программу Glasswing. Это создает своеобразную иерархию доступа, где «чистая» мощность ИИ становится привилегией, а массовый пользователь получает версию с плотными надстройками цензуры.

В Anthropic признают, что сделать модель полностью невосприимчивой к джейлбрейкам «вероятно, невозможно». В качестве системного решения компания предлагает создать единый индустриальный стандарт мониторинга угроз совместно с Google и Microsoft, а также запустила программу Bug Bounty на платформе HackerOne для поиска новых способов обхода защиты Fable 5.