Специалисты по кибербезопасности обнаружили уязвимость в локальных моделях Apple Intelligence, которая позволяла игнорировать системные инструкции и выполнять произвольный код через prompt injection. Атака строилась на обмане фильтров входных и выходных данных, которые Apple внедрила для обеспечения безопасности своих нейросетевых функций.
Anthropic объединяет технологических гигантов в рамках Project Glasswing для борьбы с уязвимостями, которые находит новая модель Claude Mythos Preview.
Компания Anthropic по ошибке удалила тысячи проектов на GitHub, пытаясь скрыть утечку исходного кода своего инструмента Claude Code.
Стартап ThroughLine разрабатывает систему перенаправления радикализованных пользователей ИИ-платформ к специалистам и экспертным чат-ботам.
Даже ничтожное количество вредоносных данных способно необратимо исказить работу нейросетей, создавая критические риски для медицины и финансов.
Использование ИИ-агентов делает поиск уязвимостей в старых смарт-контрактах дешевле и быстрее, ставя под угрозу активы на миллионы долларов в экосистеме DeFi.