Принстон

Новости

CEO-Bench

Большинство ИИ-моделей провалили тест по управлению стартапом в течение 500 дней

Исследование Принстона показало, что современные ИИ-агенты слабы в долгосрочном планировании: в симуляции стартапа CEO-Bench большинство моделей обанкротились.