Оптическое распознавание текста вышло на новый уровень с открытыми моделями
Современные открытые модели OCR преобразуют не только текст, но и сложные элементы документов: таблицы, диаграммы и изображения с сохранением структуры.
Hugging Face — GitHub для AI моделей. Крупнейшая платформа для ML сообщества. Хостинг моделей и датасетов.
Современные открытые модели OCR преобразуют не только текст, но и сложные элементы документов: таблицы, диаграммы и изображения с сохранением структуры.
Hugging Face добавила поддержку компьютерного зрения в AI Sheets — теперь можно извлекать данные из изображений, генерировать и редактировать визуальный контент прямо в таблицах без программирования.
NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.
Hugging Face представила MTEB-v2 — расширенный бенчмарк для оценки моделей эмбеддингов с 113 датасетами и поддержкой 112 языков.
Совместное тестирование Intel и Hugging Face показало 70% улучшение TCO для GPT OSS на новых процессорах Xeon 6 в Google Cloud C4.
Новая система оценки ИИ превращает плоские бенчмарки в трехмерные ландшафты мышления, используя спектральный анализ и параметрические тесты для изучения архитектуры рассуждений.