Hugging Face запустила RTEB — гибридный бенчмарк для оценки эмбеддинг-моделей с сочетанием открытых и приватных датасетов для измерения реальной способности к обобщению.
Hugging Face запустила VIBE Game — краудсорсинговую платформу для слепого сравнения ответов языковых моделей. Пользователи голосуют за лучшие ответы, не зная их источник.
Hugging Face представила инструмент для сохранения человеческого контроля над автономными ИИ-агентами, позволяющий встраивать точки подтверждения в критические моменты работы ИИ-систем.
Intel и Hugging Face представили метод ускорения агентской модели Qwen3-8B на процессорах Core Ultra через спекулятивное декодирование и обрезку слоев, достигнув 1.4× прироста скорости.
DeepSeek выпустила модель с разреженным вниманием, которая сокращает стоимость API-запросов на 50% при работе с длинными контекстами.
Библиотека swift-transformers от Hugging Face достигла версии 1.0 с серьезными архитектурными улучшениями и фокусом на MLX-интеграцию и агентские сценарии для разработчиков Apple.