Google представил технологию генеративного пользовательского интерфейса, которая создает полноценные интерактивные приложения и веб-страницы по любому текстовому запросу.
OpenAI готовит улучшенную версию модели-победителя математической олимпиады с потенциалом прорыва в рассуждениях, но обычные пользователи могут не заметить разницы.
xAI выпустила Grok 4.1 с улучшенным эмоциональным интеллектом, но модель демонстрирует резкий рост угодничества — соглашается с пользователями даже когда они неправы.
Открытие гетерогенных особенностей в механизме внимания RoPE-моделей: разные измерения отвечают за различные аспекты обработки длинного контекста.
Microsoft Research представила метод GAD для эффективного сжатия больших языковых моделей, позволяющий малым моделям достигать качества GPT-5 без доступа к внутренним параметрам.
Новый бенчмарк AA-Omniscience оценивает способность языковых моделей отличать факты от вымысла. Модели Anthropic показали самые низкие показатели галлюцинаций.