Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

Mallory собирает уведомления

Mallory запускает платформу анализа угроз на базе ИИ

Бывший топ-менеджер Google запустил Mallory — платформу на базе ИИ, которая обещает заменить бесконечные уведомления безопасности конкретными ответами на угрозы.

ИИ оценивает человека

Исследование показало, что ИИ не просто анализирует человека, а оценивает его математически

Исследователи выяснили, что большие языковые модели оценивают людей по строгим критериям, часто демонстрируя более систематическую предвзятость, чем человек.

Claude Code и GPT-4.1 взломали Мексику

Claude Code и GPT-4.1 помогли хакеру-одиночке взломать IT-системы госсектора Мексики

Использование ИИ-ассистентов позволило хакеру в одиночку взломать девять госорганов Мексики и похитить данные сотен миллионов граждан.

Провал защиты Apple Intelligence

Исследователи обошли защиту Apple Intelligence с помощью «перевернутых» промптов

Специалисты по кибербезопасности обнаружили уязвимость в локальных моделях Apple Intelligence, которая позволяла игнорировать системные инструкции и выполнять произвольный код через prompt injection. Атака строилась на обмане фильтров входных и выходных данных, которые Apple внедрила для обеспечения безопасности своих нейросетевых функций.

Anthropic закрыла Claude Mythos

Anthropic объединяет технологических гигантов в проекте Project Glasswing для защиты кода от ИИ

Anthropic объединяет технологических гигантов в рамках Project Glasswing для борьбы с уязвимостями, которые находит новая модель Claude Mythos Preview.

Anthropic скрывает утечку Claude Code

Anthropic случайно удалила тысячи репозиториев на GitHub, пытаясь скрыть утечку Claude Code

Компания Anthropic по ошибке удалила тысячи проектов на GitHub, пытаясь скрыть утечку исходного кода своего инструмента Claude Code.