Оптическое распознавание текста вышло на новый уровень с открытыми моделями
Современные открытые модели OCR преобразуют не только текст, но и сложные элементы документов: таблицы, диаграммы и изображения с сохранением структуры.
15 января 2026
Современные открытые модели OCR преобразуют не только текст, но и сложные элементы документов: таблицы, диаграммы и изображения с сохранением структуры.
Hugging Face добавила поддержку компьютерного зрения в AI Sheets — теперь можно извлекать данные из изображений, генерировать и редактировать визуальный контент прямо в таблицах без программирования.
NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.
Google Cloud расширила возможности отслеживания происхождения данных в Dataplex до уровня отдельных столбцов для BigQuery, что критично для построения надежных AI-систем.
Amazon представила архитектуру многокомпонентных голосовых ассистентов, объединяющую Nova Sonic и Bedrock AgentCore для создания распределенных ИИ-систем со специализированными агентами.
AWS представила бессерверное развертывание моделей для Amazon SageMaker Canvas, упрощая вывод ML-моделей в продакшен для бизнес-пользователей без DevOps-навыков.