Новый бенчмарк ALE от ученых из Беркли показал, что GPT-5.5 справляется с комплексными профессиональными задачами лучше конкурентов, хотя общий уровень готовности ИИ остается низким.
Модель GPT-5.5 демонстрирует значительный рост эффективности в проектировании сложных систем, снижая количество ре-промптов и улучшая удержание контекста.
OpenAI предоставила девяти британским банкам доступ к инструменту кибербезопасности GPT-5.5 Cyber, заполнив нишу после отказа Anthropic поставлять модель Mythos.
Стартап Datacurve представил DeepSWE — новый бенчмарк для ИИ-кодеров, который выявил превосходство GPT-5.5 и критические ошибки в старых методах оценки.
Крупный счет в 1,3 млн долларов за использование API OpenAI выявил реальную стоимость содержания флота автономных ИИ-агентов в разработке.
Использование новых моделей ИИ от Anthropic и OpenAI позволило Palo Alto Networks обнаружить в семь раз больше уязвимостей в своих продуктах, чем обычно.