Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

ChatGPT Lockdown Mode

ChatGPT вводит режим Lockdown Mode, изолирующий нейросеть от внешнего мира

OpenAI представила Lockdown Mode для ChatGPT — новый инструмент безопасности, ограничивающий доступ к интернету для защиты данных от сложных атак.

взлом Salesforce Experience Cloud

Автономного ИИ-агента обучили полному циклу взлома сайтов на Salesforce Experience Cloud

Автономный ИИ-агент научился проводить полный цикл кибератаки на сайты Salesforce Experience Cloud, используя LLM для написания эксплойтов и анализа данных.

AI Worm LLM

Исследователи создали самовоспроизводящегося ИИ-червя на базе локальных LLM

Ученые из Университета Торонто создали прототип вредоносного ПО, которое использует локальные ИИ-модели для поиска уязвимостей и самораспространения.

ИИ взлом Instagram

Уязвимость в ИИ-чатботе поддержки Meta* позволила хакерам захватить аккаунты Instagram

Злоумышленники захватили высокопрофильные аккаунты Instagram, убедив чат-бота Meta* AI изменить электронную почту и обойти двухфакторную аутентификацию.

LLM доверяют лжи

Исследование показало, что LLM доверяют ложным документам даже вопреки предупреждениям

Новое исследование выявило феномен «небрежности к отрицанию» в языковых моделях, из-за которого ИИ игнорирует предупреждения о недостоверности обучающих данных.

бенчмарк DeepSWE

Новый бенчмарк DeepSWE раскрыл уязвимости моделей Claude и сделал лидером GPT-5.5

Стартап Datacurve представил DeepSWE — новый бенчмарк для ИИ-кодеров, который выявил превосходство GPT-5.5 и критические ошибки в старых методах оценки.