Исследование показывает, что обучение на плохих данных ухудшает способности LLM
Исследование показало, что обучение языковых моделей на низкокачественных данных ухудшает их способности к рассуждению и работе с длинным контекстом.
Hugging Face — GitHub для AI моделей. Крупнейшая платформа для ML сообщества. Хостинг моделей и датасетов.
Исследование показало, что обучение языковых моделей на низкокачественных данных ухудшает их способности к рассуждению и работе с длинным контекстом.
Популярный фреймворк Sentence Transformers официально переходит под управление Hugging Face, что укрепит позиции платформы как центрального хаба для NLP-разработчиков.
Hugging Face интегрировал сканирование VirusTotal для проверки 2.2+ млн моделей и наборов данных на наличие вредоносного кода, усиливая безопасность open-source AI экосистемы.
Hugging Face представила PromoterGPT — специализированную языковую модель для анализа промоутеров ДНК, которая точно идентифицирует регуляторные генетические последовательности.
Современные открытые модели OCR преобразуют не только текст, но и сложные элементы документов: таблицы, диаграммы и изображения с сохранением структуры.
Hugging Face добавила поддержку компьютерного зрения в AI Sheets — теперь можно извлекать данные из изображений, генерировать и редактировать визуальный контент прямо в таблицах без программирования.