Mallory запускает платформу анализа угроз на базе ИИ
Бывший топ-менеджер Google запустил Mallory — платформу на базе ИИ, которая обещает заменить бесконечные уведомления безопасности конкретными ответами на угрозы.
Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.
Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.
Бывший топ-менеджер Google запустил Mallory — платформу на базе ИИ, которая обещает заменить бесконечные уведомления безопасности конкретными ответами на угрозы.
Исследователи выяснили, что большие языковые модели оценивают людей по строгим критериям, часто демонстрируя более систематическую предвзятость, чем человек.
Использование ИИ-ассистентов позволило хакеру в одиночку взломать девять госорганов Мексики и похитить данные сотен миллионов граждан.
Специалисты по кибербезопасности обнаружили уязвимость в локальных моделях Apple Intelligence, которая позволяла игнорировать системные инструкции и выполнять произвольный код через prompt injection. Атака строилась на обмане фильтров входных и выходных данных, которые Apple внедрила для обеспечения безопасности своих нейросетевых функций.
Anthropic объединяет технологических гигантов в рамках Project Glasswing для борьбы с уязвимостями, которые находит новая модель Claude Mythos Preview.
Компания Anthropic по ошибке удалила тысячи проектов на GitHub, пытаясь скрыть утечку исходного кода своего инструмента Claude Code.