Большинство ИИ-моделей провалили тест по управлению стартапом в течение 500 дней
Исследование Принстона показало, что современные ИИ-агенты слабы в долгосрочном планировании: в симуляции стартапа CEO-Bench большинство моделей обанкротились.
Исследование Принстона показало, что современные ИИ-агенты слабы в долгосрочном планировании: в симуляции стартапа CEO-Bench большинство моделей обанкротились.