Hugging Face представила ProCreations — диффузионную языковую модель для генерации изображений по текстовым описаниям, расширяющую возможности творческого ИИ.
Представлена первая открытая OCR-модель для марокканского диалекта Darija на базе Vision Language Model с 3B параметрами, решающая проблему обработки низкоресурсных языков.
Hugging Face выпустила LeRobotDataset v3 с поддержкой потоковой обработки больших наборов данных для обучения роботов. Новый формат решает проблему масштабирования и позволяет работать с миллионами эпизодов.
Hugging Face представила инструмент на базе Gradio для обнаружения водяных знаков в текстах, сгенерированных языковыми моделями.
BigQuery ML теперь поддерживает Gemini embedding model и 13K+ open-source моделей для генерации текстовых эмбеддингов напрямую через SQL-запросы.
Hugging Face выпустила открытый фреймворк для систематической оценки и сравнения больших языковых моделей по различным метрикам производительности.