Claude Fable 5 оказалась слабее GPT-5.5 в новом стресс-тесте для ИИ-агентов Agents’ Last Exam
Новый бенчмарк ALE от ученых из Беркли показал, что GPT-5.5 справляется с комплексными профессиональными задачами лучше конкурентов, хотя общий уровень готовности ИИ остается низким.