Анализ эффективности инструментов для обнаружения текста, сгенерированного ChatGPT. Рассматриваются принципы работы детекторов, их сильные и слабые стороны, а также правильные стратегии использования.
Новая техника машинного обучения позволяет находить и удалять опасные знания о психическом здоровье из языковых моделей, решая проблему вредоносных советов, которые ИИ усваивает из интернета.
Исследования показывают, что современные ИИ-чат-боты в 10 раз эффективнее меняют политические взгляды, чем традиционная реклама, но их убедительность обратно пропорциональна точности фактов.
Google разработал систему Urania для анализа использования чат-ботов с математическими гарантиями приватности. Фреймворк превосходит существующие методы защиты данных.
Исследование показало снижение прозрачности в индустрии ИИ: средний балл компаний упал до 40 из 100. IBM лидирует с 95 баллами, xAI и Midjourney — аутсайдеры с 14 баллами.
Google представила многоуровневую систему безопасности для агентских функций Chrome, включающую контроль действий, ограничение доступа к сайтам и пользовательский контроль для чувствительных операций.