Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

Браузерные расширения собирают данные

Браузерные расширения могут собирать диалоги пользователей с ИИ ради рекламы

Восемь популярных браузерных расширений с 8 млн установок тайно собирают полные диалоги пользователей с ChatGPT, Claude и другими ИИ для продажи маркетологам. Расширения обещают защиту, но сами являются инструментом слежки.

Бенчмарк Phare V2 не оценил модели

Бенчмарк Phare V2 показал, что современные и продвинутые LLM не становятся безопаснее

Новое исследование Phare V2 показывает, что прогресс в возможностях языковых моделей не привел к аналогичному улучшению их безопасности. Рассуждающие модели не стали устойчивее к взлому, галлюцинациям и предвзятости.

Браузеры с ИИ-агентами опасны

Браузеры с ИИ-агентами — это удобно, но проблемы с безопасностью не решаются

Новые браузеры с ИИ-агентами, которые могут действовать в интернете от вашего имени, сталкиваются с серьезными проблемами безопасности, включая уязвимости к скрытым командам и риск компрометации личных данных.

Противники ИИ не сдаются

Противники ИИ не сдаются, несмотря на то, что их прогнозы конца света провалились

Сторонники теории скорого апокалипсиса от ИИ, чьи прогнозы не сбылись, не сдаются. Вместо этого они перешли от научных дискуссий к политическому лоббизму, находя поддержку у регуляторов.

правила Азимова для ИИ не работают

Почему правила Азимова для ИИ не работают в реальном мире

Почему классические законы робототехники Азимова не работают для современных ИИ, и почему попытки создать «этичный ИИ» сталкиваются с фундаментальными противоречиями в реальном мире.

Детекторы ChatGPT не работают

Почему «детекторы ChatGPT» до сих пор не могут определить текст, написанный ИИ

Анализ эффективности инструментов для обнаружения текста, сгенерированного ChatGPT. Рассматриваются принципы работы детекторов, их сильные и слабые стороны, а также правильные стратегии использования.