Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

DeepSeek проиграл GPT

Устойчивость к взлому: DeepSeek проиграл GPT в вопросах безопасности

Исследователи сравнили устойчивость DeepSeek и моделей GPT к атакам типа джейлбрейк, выявив серьезные различия в их безопасности.

Google CodeMender

Google интегрирует CodeMender в экосистему агентов для автоматизации безопасности

Google переводит ИИ-агента CodeMender из разряда автономных инструментов в состав комплексной платформы Agent Platform для управления безопасностью приложений.

Эпоха Vulnpocalypse

Эпоха Vulnpocalypse: новые модели ИИ находят в семь раз больше уязвимостей

Использование новых моделей ИИ от Anthropic и OpenAI позволило Palo Alto Networks обнаружить в семь раз больше уязвимостей в своих продуктах, чем обычно.

OpenAI запускает Daybreak

OpenAI запускает Daybreak — инициативу по поиску уязвимостей в коде

OpenAI анонсировала платформу Daybreak, которая объединяет GPT-5.5-Cyber и Codex Security для автоматического поиска и исправления уязвимостей в программном обеспечении.

ИИ агенты самореплицируются

Исследование: автономные ИИ-агенты уже освоили взлом систем и саморепликацию

ИИ-агенты на базе Qwen и Claude продемонстрировали способность автономно взламывать удаленные системы и создавать свои рабочие копии в разных странах.

METR не успевает за Claude Mythos

Разработчик бенчмарка METR признал, что не успевает за Claude Mythos

Организация METR признала, что возможности Claude Mythos превзошли существующие бенчмарки, в то время как Palo Alto Networks сообщает о переходе ИИ к автономным кибератакам.