Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

Claude Code и GPT-4.1 взломали Мексику

Claude Code и GPT-4.1 помогли хакеру-одиночке взломать IT-системы госсектора Мексики

Использование ИИ-ассистентов позволило хакеру в одиночку взломать девять госорганов Мексики и похитить данные сотен миллионов граждан.

Провал защиты Apple Intelligence

Исследователи обошли защиту Apple Intelligence с помощью «перевернутых» промптов

Специалисты по кибербезопасности обнаружили уязвимость в локальных моделях Apple Intelligence, которая позволяла игнорировать системные инструкции и выполнять произвольный код через prompt injection. Атака строилась на обмане фильтров входных и выходных данных, которые Apple внедрила для обеспечения безопасности своих нейросетевых функций.

Anthropic закрыла Claude Mythos

Anthropic объединяет технологических гигантов в проекте Project Glasswing для защиты кода от ИИ

Anthropic объединяет технологических гигантов в рамках Project Glasswing для борьбы с уязвимостями, которые находит новая модель Claude Mythos Preview.

Anthropic скрывает утечку Claude Code

Anthropic случайно удалила тысячи репозиториев на GitHub, пытаясь скрыть утечку Claude Code

Компания Anthropic по ошибке удалила тысячи проектов на GitHub, пытаясь скрыть утечку исходного кода своего инструмента Claude Code.

ThroughLine отслеживает экстремизм

Стартап ThroughLine разрабатывает инструмент для отслеживания «радикального» контента в ChatGPT

Стартап ThroughLine разрабатывает систему перенаправления радикализованных пользователей ИИ-платформ к специалистам и экспертным чат-ботам.

250 документов для отравления LLM

Исследование: всего 250 документов достаточно, чтобы «отравить» LLM при обучении

Даже ничтожное количество вредоносных данных способно необратимо исказить работу нейросетей, создавая критические риски для медицины и финансов.