OpenAI представила бенчмарк GDPval, где GPT-5 показывает паритет с человеческими экспертами в 40.6% случаев, а Claude Opus 4.1 — в 49%. Тестирование охватывает 9 отраслей и 44 профессии.
Databricks и OpenAI объявили о партнерстве, позволяющем предприятиям запускать GPT-5 непосредственно на своих данных в защищенной среде с полным контролем безопасности и управлением.
ChatGPT с заявленным интеллектом уровня PhD демонстрирует системные сбои при ответах на простые вопросы про буквы алфавита, выявляя фундаментальные ограничения архитектуры GPT-5.
OpenAI интегрирует GPT-5 в корейский мессенджер KakaoTalk с октября 2025 года. Партнерство позволит 50 млн пользователей получить доступ к последней языковой модели без отдельного приложения.
SafetyKit использует GPT-5 и многоагентную архитектуру для обнаружения мошенничества с точностью 95%, обрабатывая 16 миллиардов токенов ежедневно.
OpenAI провела глобальное исследование с участием 1000+ человек для определения этических стандартов ИИ. Результаты показывают 80% согласие с текущей спецификацией, но выявляют разногласия в политическом и чувствительном контенте.