Claude Code Security от Anthropic «читает» код, как исследователь: понимает потоки данных, находит логику ошибок и генерирует патчи с рейтингом. Минус ложных позитивов — многоступенчатая проверка ИИ. Уже нашёл 500+ багов в open-source, но риски: такие же инструменты помогут хакерам.
Агентные ИИ не ломаются внезапно: они дрейфуют — меняют поведение от обновлений промптов и инструментов, накапливая риски месяцами. Традиционные тесты не ловят это, нужна поведенческая диагностика для CIO и CTO.
Восемь популярных браузерных расширений с 8 млн установок тайно собирают полные диалоги пользователей с ChatGPT, Claude и другими ИИ для продажи маркетологам. Расширения обещают защиту, но сами являются инструментом слежки.
Новое исследование Phare V2 показывает, что прогресс в возможностях языковых моделей не привел к аналогичному улучшению их безопасности. Рассуждающие модели не стали устойчивее к взлому, галлюцинациям и предвзятости.
Новые браузеры с ИИ-агентами, которые могут действовать в интернете от вашего имени, сталкиваются с серьезными проблемами безопасности, включая уязвимости к скрытым командам и риск компрометации личных данных.
Сторонники теории скорого апокалипсиса от ИИ, чьи прогнозы не сбылись, не сдаются. Вместо этого они перешли от научных дискуссий к политическому лоббизму, находя поддержку у регуляторов.