Компания Nous Research представила метод Token Superposition Training, позволяющий ускорить предварительное обучение LLM до 2,5 раз за счет работы с пакетами токенов.
Anthropic представила Dreaming — новую функцию для Claude, позволяющую ИИ-агентам анализировать прошлые ошибки и оптимизировать рабочие процессы через асинхронную обработку памяти.
Исследования подтверждают, что обучение больших языковых моделей на собственных данных ведет к статистической сингулярности и потере связи с реальностью.
Система Prompt Quality Score анализирует запросы к ИИ по восьми параметрам, помогая исправить ошибки до начала дорогостоящей генерации.
Технологические гиганты собирают видеозаписи обычных домашних дел, чтобы научить роботов складывать одежду и убираться. Рассказываем, почему это сложнее, чем создать ChatGPT.
Hugging Face выпустила версию TRL v1.0, которая стандартизирует процесс постренировки и дообучения языковых моделей, делая его доступным для инженеров любого уровня.