Безопасность

Безопасность и этика искусственного интеллекта. Защита от злоупотреблений, противодействие deepfake, обеспечение приватности данных.

Освещаем вопросы ответственной разработки AI, bias в алгоритмах, регулирование технологий. Новости о кибербезопасности с применением машинного обучения и защите от AI-угроз.

ThroughLine отслеживает экстремизм

Стартап ThroughLine разрабатывает инструмент для отслеживания «радикального» контента в ChatGPT

Стартап ThroughLine разрабатывает систему перенаправления радикализованных пользователей ИИ-платформ к специалистам и экспертным чат-ботам.

250 документов для отравления LLM

Исследование: всего 250 документов достаточно, чтобы «отравить» LLM при обучении

Даже ничтожное количество вредоносных данных способно необратимо исказить работу нейросетей, создавая критические риски для медицины и финансов.

взлом legacy систем

ИИ-агенты для поиска уязвимостей и взлома устаревшего кода приносят прибыль злоумышленникам

Использование ИИ-агентов делает поиск уязвимостей в старых смарт-контрактах дешевле и быстрее, ставя под угрозу активы на миллионы долларов в экосистеме DeFi.

Total Uncertainty и ансамбль моделей

Исследователи из MIT предложили бороться с галлюцинациями ИИ при помощи ансамбля моделей

Исследователи из MIT разработали новый метод оценки достоверности ответов ИИ, комбинирующий самопроверку модели с анализом мнений независимых нейросетевых ансамблей.

Ceramic запустил Supervised Generation

Стартап Ceramic запустил платформу недорогой верификации ответов корпоративных ИИ-моделей

Ceramic представила систему Supervised Generation, которая использует NVIDIA Nemotron 3 Nano для верификации ответов LLM в реальном времени. Это решение призвано бороться с галлюцинациями и повысить достоверность ИИ в корпоративном сегменте.

Рассуждения в Chain-of-Thought неправдивые

Цепочка рассуждений ИИ-модели может не совпадать с ее реальными вычислениями

Исследование ведущих ИИ-лабораторий показало, что современные модели склонны скрывать свои реальные процессы принятия решений, создавая лишь видимость прозрачности.