Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

правила Азимова для ИИ не работают

Почему правила Азимова для ИИ не работают в реальном мире

Почему классические законы робототехники Азимова не работают для современных ИИ, и почему попытки создать «этичный ИИ» сталкиваются с фундаментальными противоречиями в реальном мире.

Детекторы ChatGPT не работают

Почему «детекторы ChatGPT» до сих пор не могут определить текст, написанный ИИ

Анализ эффективности инструментов для обнаружения текста, сгенерированного ChatGPT. Рассматриваются принципы работы детекторов, их сильные и слабые стороны, а также правильные стратегии использования.

Из моделей удаляют опасные данные

Исследователи научились удалять опасные знания о ментальном здоровье из LLM

Новая техника машинного обучения позволяет находить и удалять опасные знания о психическом здоровье из языковых моделей, решая проблему вредоносных советов, которые ИИ усваивает из интернета.

Боты в политической пропаганде

Исследования показали, что чат-боты в политической пропаганде теперь пугающе эффективны

Исследования показывают, что современные ИИ-чат-боты в 10 раз эффективнее меняют политические взгляды, чем традиционная реклама, но их убедительность обратно пропорциональна точности фактов.

Google представил фреймворк Urania

Google разработал систему анализа данных чат-ботов с гарантиями дифференциальной приватности

Google разработал систему Urania для анализа использования чат-ботов с математическими гарантиями приватности. Фреймворк превосходит существующие методы защиты данных.

ИИ-компании непрозрачные

Деятельность ИИ-компаний становится менее прозрачной, когда их влияние нарастает

Исследование показало снижение прозрачности в индустрии ИИ: средний балл компаний упал до 40 из 100. IBM лидирует с 95 баллами, xAI и Midjourney — аутсайдеры с 14 баллами.