LightOnOCR-1B устанавливает новый стандарт эффективности в оптическом распознавании текста — работает в 6 раз быстрее конкурентов при стоимости менее $0,01 за 1000 страниц.
Современные открытые модели OCR преобразуют не только текст, но и сложные элементы документов: таблицы, диаграммы и изображения с сохранением структуры.
Китайская компания DeepSeek разработала систему OCR, которая сжимает текст из изображений в 10 раз, позволяя ИИ обрабатывать больше документов без перегрузки памяти.
Baidu выпустила PP-OCRv5 — специализированную систему OCR, которая превосходит крупные мультимодальные модели в точности распознавания текста и эффективности работы на CPU.