Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

ChatGPT для юридических консультаций

Почему опасно использовать ChatGPT для юридических консультаций

Адвокат предупредил, что ChatGPT не предоставляет адвокатскую тайну, и все ваши юридические вопросы могут быть использованы против вас в суде.

Миллионы обуждают суицид с ChatGPT

Более миллиона человек каждую неделю обсуждают суицидальные мысли с ChatGPT

OpenAI раскрыла статистику: более миллиона пользователей еженедельно обсуждают с ChatGPT суицидальные мысли. Компания улучшила реакции модели на 65% при участии 170 экспертов.

Проекционные атаки на LLM

Исследование: проекционные атаки могут обходить защитные механизмы LLM

Исследователи обнаружили метод обхода систем безопасности языковых моделей через манипуляцию проекционными матрицами, что ставит под вопрос эффективность текущих подходов к защите ИИ.

Агентный веб-браузинг

Агентный веб-браузинг демонстрирует фундаментальные уязвимости интернета

Агентные браузеры вроде Comet и Claude демонстрируют фундаментальные уязвимости интернета, созданного для людей. Скрытые инструкции могут управлять ИИ-агентами без ведома пользователя.

Cloudflare нейтрализовал атаку на npm

Как Cloudflare нейтрализовал масштабную атаку на npm через машинное обучение

Cloudflare предотвратил крупную атаку на npm-пакеты с помощью машинного обучения, анализирующего 3.5 млрд скриптов в день. Модель обнаружила все 18 вредоносных пакетов без предварительного обучения на подобных атаках.

Cloudflare запускает защиту оплаты

Cloudflare запускает защиту автоматической оплаты для ИИ-агентов с Visa и Mastercard

Cloudflare совместно с Visa и Mastercard разрабатывает систему безопасности для автоматической коммерции, где ИИ-агенты совершают покупки от имени пользователей с криптографической аутентификацией.