Индийские исследователи создают уникальный датасет из 50 000 слов для перевода исторических документов с моди-письма на современный маратхи, используя древние словари и современные AI-технологии.
Hugging Face представляет Smol2Operator — методологию превращения легковесных vision-language моделей в агентов для автоматизации графических интерфейсов с открытым кодом и данными.
Meta представляет Gaia2 — новый агентный бенчмарк с открытым фреймворком ARE для тестирования ИИ-агентов в условиях, максимально приближенных к реальному миру.
ServiceNow анонсировала SyGra — low-code фреймворк для генерации и преобразования данных для обучения языковых моделей. Решение упрощает создание сложных датасетов для SFT, DPO и RAG-пайплайнов.
PyTorch выпустил предварительно квантованные версии популярных языковых моделей с рецептами оптимизации для серверных GPU и мобильных устройств.
Семейство доменно-специализированных энкодеров RexBERT для электронной коммерции демонстрирует превосходство над общецелевыми моделями в 2-3 раза большего размера.