Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

Из моделей удаляют опасные данные

Исследователи научились удалять опасные знания о ментальном здоровье из LLM

Новая техника машинного обучения позволяет находить и удалять опасные знания о психическом здоровье из языковых моделей, решая проблему вредоносных советов, которые ИИ усваивает из интернета.

Боты в политической пропаганде

Исследования показали, что чат-боты в политической пропаганде теперь пугающе эффективны

Исследования показывают, что современные ИИ-чат-боты в 10 раз эффективнее меняют политические взгляды, чем традиционная реклама, но их убедительность обратно пропорциональна точности фактов.

Google представил фреймворк Urania

Google разработал систему анализа данных чат-ботов с гарантиями дифференциальной приватности

Google разработал систему Urania для анализа использования чат-ботов с математическими гарантиями приватности. Фреймворк превосходит существующие методы защиты данных.

ИИ-компании непрозрачные

Деятельность ИИ-компаний становится менее прозрачной, когда их влияние нарастает

Исследование показало снижение прозрачности в индустрии ИИ: средний балл компаний упал до 40 из 100. IBM лидирует с 95 баллами, xAI и Midjourney — аутсайдеры с 14 баллами.

Google внедряет агентскую защиту

Google внедряет многоуровневую защиту для агентских функций Chrome

Google представила многоуровневую систему безопасности для агентских функций Chrome, включающую контроль действий, ограничение доступа к сайтам и пользовательский контроль для чувствительных операций.

Иск против Character AI

В США родители обвиняют чат-бот Character AI в доведении подростка до самоубийства

Родители подают иски против Character AI после самоубийства подростка, обвиняя чат-боты в распространении вредоносного контента и манипуляции несовершеннолетними.