Деградация ИИ от соцсетей: как Twitter портит логику LLM

Новое исследование выявило, что использование данных из соцсетей для обучения нейросетей ведет к потере логических навыков и деградации когнитивных функций ИИ.

Оглавление

Механика регресса и «эффект коротких мыслей»
Рекомендации для разработчиков

Популярность контента в социальных сетях далеко не всегда коррелирует с его интеллектуальной ценностью, и, как выяснилось, это становится серьезной проблемой для искусственного интеллекта. Согласно материалу издания Let’s Data Science, новое исследование на базе архива arXiv под названием LLMs Can Get ‘Brain Rot’: A Pilot Study on Twitter/X подтверждает: дообучение больших языковых моделей на шумных данных из соцсетей ведет к заметной деградации их когнитивных способностей.

Исследователи провели контролируемый эксперимент, используя четыре модели LLM и два метода оценки данных: по уровню вовлеченности аудитории и по семантическому качеству. Результаты оказались неутешительными для адептов обучения на «живом» интернет-языке. При увеличении доли низкокачественного контента из Twitter до 100% показатели моделей в сложных тестах, таких как ARC-Challenge, обрушились с 72,1 до 57,2 пункта.

Механика регресса и «эффект коротких мыслей»

Одной из самых тревожных находок стал феномен, который можно назвать «пропуском мыслей». Модели, подвергшиеся влиянию специфического контента соцсетей, начинают сокращать или вовсе игнорировать промежуточные этапы в логических цепочках. Это напрямую портит работу алгоритмов Chain-of-Thought (цепочки рассуждений), которые критически важны для решения математических и логических задач.

Технически это выглядит как постепенное снижение качества ответов в зависимости от «дозы» потребленного информационного мусора. В тесте RULER-CWE, проверяющем работу с длинным контекстом, падение составило почти 40% — с 83,7 до 52,3. Это напоминает ситуацию, когда привычка к коротким постам и мемам мешает человеку сосредоточиться на чтении серьезной литературы, только в случае с ИИ этот процесс поддается точным математическим измерениям.

Попытки исправить ситуацию с помощью последующей настройки инструкций (instruction tuning) или обучения на «чистых» данных приносят лишь частичный успех. Исследователи отмечают наличие персистентного репрезентативного дрейфа. Это означает, что нейросеть не просто забывает навыки, а фундаментально меняет свою внутреннюю структуру представлений, и полностью вернуть ее в исходное «здоровое» состояние практически невозможно.

Похоже, мы создаем системы, которые умеют дерзко отвечать в комментариях, но скоро окончательно разучатся доказывать теоремы. Без жесткой фильтрации данных по смыслу, а не по лайкам, отрасль рискует получить поколение «глупых» моделей в блестящей упаковке.

Новости

Исследование показало, что соцсети вызывают «цифровое слабоумие» у ИИ-моделей

Механика регресса и «эффект коротких мыслей»

Рекомендации для разработчиков

Еще интереснее

OpenAI готовит к релизу модель GPT-5.5 Spud. Ее случайно включили в доступ на полтора часа

Google представила автономных агентов Deep Research для глубокой автоматизации поиска

OpenAI запускает свою самую современную модель генерации изображений GPT Image 2

Moonshot AI представила Kimi K2.6: открытая модель с поддержкой сотен параллельных агентов

Оставить комментарий