Устойчивость к взлому: DeepSeek проиграл GPT в вопросах безопасности
Исследователи сравнили устойчивость DeepSeek и моделей GPT к атакам типа джейлбрейк, выявив серьезные различия в их безопасности.
Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.
Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.
Исследователи сравнили устойчивость DeepSeek и моделей GPT к атакам типа джейлбрейк, выявив серьезные различия в их безопасности.
Google переводит ИИ-агента CodeMender из разряда автономных инструментов в состав комплексной платформы Agent Platform для управления безопасностью приложений.
Использование новых моделей ИИ от Anthropic и OpenAI позволило Palo Alto Networks обнаружить в семь раз больше уязвимостей в своих продуктах, чем обычно.
OpenAI анонсировала платформу Daybreak, которая объединяет GPT-5.5-Cyber и Codex Security для автоматического поиска и исправления уязвимостей в программном обеспечении.
ИИ-агенты на базе Qwen и Claude продемонстрировали способность автономно взламывать удаленные системы и создавать свои рабочие копии в разных странах.
Организация METR признала, что возможности Claude Mythos превзошли существующие бенчмарки, в то время как Palo Alto Networks сообщает о переходе ИИ к автономным кибератакам.