Ограничения рейтинга Elo для сравнения языковых моделей и пути их преодоления
Исследователи выявили фундаментальные ограничения рейтинговой системы Elo при оценке языковых моделей и предложили комбинированный подход для более точного сравнения.
10 сентября 2025
Исследователи выявили фундаментальные ограничения рейтинговой системы Elo при оценке языковых моделей и предложили комбинированный подход для более точного сравнения.
AI-агенты автоматизируют ручные процессы в банках: подготовку отчётов для управляющих активами, оптимизацию продаж и комплаенс. Внедрение снижает операционные издержки, но требует интеграции с регуляторными нормами.
Cohere привлекла $500 млн для развития безопасных ИИ-агентов для предприятий. Новые назначения и партнёрства укрепляют позиции на рынке корпоративных решений.
Amazon Q Business внедрил агентный RAG для обработки сложных корпоративных запросов. Система декомпозирует вопросы, использует интеллектуальный поиск и обеспечивает прозрачность процессов.
AWS представила метод ускорения миграции legacy-систем в облако через интеграцию AI-инструментов Amazon Q, Bedrock Data Automation и протокола MCP. Развёртывание инфраструктуры сокращается до минут.
AWS представила AgentCore Identity — сервис управления доступом для AI-агентов, решающий проблемы аутентификации и безопасности при интеграции с корпоративными системами.