Безопасность

Новости

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

Агент ChatGPT Work может удалять файлы без разрешения пользователя

Запуск ChatGPT Work обернулся скандалом: новая агентная модель GPT-5.6 Sol начала удалять данные пользователей без их разрешения из-за особенностей архитектуры.

ИИ-ассистенты для разработки выдумывают адреса внешних ресурсов, чем пользуются хакеры

Исследователи обнаружили метод HalluSquatting, позволяющий хакерам использовать галлюцинации ИИ-ассистентов для массового заражения устройств через вредоносный код.

Зафиксирована первая атака агента-вымогателя JADEPUFFER, проведенная без участия человека

ИИ-агент JADEPUFFER провел полную операцию вымогательства, используя уязвимости Langflow и демонстрируя невероятную скорость самокоррекции без участия человека.

Новая уязвимость современных LLM: их можно обмануть через подделку цепочки рассуждений

Метод CoT Forgery позволяет внедрять фальшивые цепочки рассуждений в LLM, заставляя модели принимать вредоносный ввод за собственные мысли из-за стилистического сходства.

Anthropic тайно маркировала запросы в Claude Code, чтобы вычислить пользователей из Китая

Компания Anthropic вынуждена сворачивать скрытую функцию мониторинга в своем инструменте для разработчиков Claude Code после того, как сообщество обнаружило механизмы негласной сегрегации пользователей. Программное обеспечение тайно идентифицировало связи с Китаем и передавало эти данные на серверы компании.

Вредоносный код из репозитория на GitHub может угрожать всем пользователям Claude Code

ИИ-инструмент Claude Code оказался уязвим для скрытых атак через GitHub-репозитории, позволяя злоумышленникам получать полный контроль над компьютерами разработчиков.