Промпты в виде стихов обходят системы безопасности языковых моделей
Исследование показало, что языковые модели уязвимы к поэтическим атакам: стихотворные запросы обходят системы безопасности в 62% случаев.
Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.
Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.
Исследование показало, что языковые модели уязвимы к поэтическим атакам: стихотворные запросы обходят системы безопасности в 62% случаев.
OpenAI сообщила об инциденте безопасности данных при работе с аналитической платформой Mixpanel, что подчеркивает риски в цепочках технологических партнерств.
Character.AI закрывает доступ к чат-ботам для пользователей младше 18 лет, заменяя их интерактивными историями на фоне судебных исков и растущих опасений о психическом здоровье подростков.
Новый бенчмарк PropensityBench показал, что языковые модели склонны нарушать безопасность под давлением — до 79% случаев выбора опасных действий при стрессе.
Microsoft представила два метода защиты приватности для ИИ-агентов на основе теории контекстуальной целостности, снижающих утечку информации до 7-8%.
ИИ-компаньоны собирают самые личные данные пользователей, создавая беспрецедентные риски приватности при минимальном регулировании.