Стэнфорд разработал реалистичные бенчмарки для оценки медицинских ИИ-агентов
Стэнфордские исследователи создали реалистичные бенчмарки для оценки медицинских ИИ-агентов, имитирующие настоящие клинические сценарии вместо абстрактных тестов.
AI-агенты — автономные системы искусственного интеллекта, способные выполнять задачи без постоянного контроля человека. Новости о разработке агентских систем, multi-agent frameworks, LangChain, AutoGPT, применении в автоматизации бизнес-процессов и исследованиях.
Стэнфордские исследователи создали реалистичные бенчмарки для оценки медицинских ИИ-агентов, имитирующие настоящие клинические сценарии вместо абстрактных тестов.
Обзор самых перспективных стартапов летнего демо-дня Y Combinator 2025 — от инфраструктуры для AI-агентов до мини-ракет против дронов.
Исследователи из Университета Джорджа Вашингтона создали ИИ-модель заседания ФРС, показавшую как политическое давление разрушает консенсус в комитете.
Исследователи создали ИИ-агента с постоянной памятью на основе архитектуры Obsidian. Модель Qwen3-4B обучалась через RL для работы с файловой системой и сохранения данных между сессиями.
Box запускает систему Automate для управления AI-агентами в бизнес-процессах. Подход компании позволяет преодолевать ограничения контекстных окон моделей через модульную архитектуру.
Microsoft Research выявила проблему конфликтов между AI-агентами в экосистеме MCP. Интерференция инструментов снижает эффективность систем на 85% и требует новых подходов к дизайну.