GPT-5 демонстрирует технические улучшения в скорости и надежности, но не оправдывает ожиданий революционного прорыва. Модель стала более предсказуемой, но потеряла креативность.
OpenAI опубликовала первое исследование использования ChatGPT на основе внутренних данных: 700 млн пользователей, рост личного использования и доминирование письменных задач.
Scale обнаружила фундаментальную проблему нестабильности LLM-оценок с вариативностью до 15% и предложила решение через когорту из трех моделей-судей.
Anthropic опубликовала географический анализ использования ИИ Claude, выявивший сильную корреляцию между экономическим развитием регионов и уровнем внедрения искусственного интеллекта.
Крупнейшее исследование OpenAI показывает: ChatGPT используют 700 млн человек еженедельно, гендерный разрыв сократился, а развивающиеся страны adopt технологию в 4 раза быстрее.
Hugging Face выпустила открытый фреймворк для систематической оценки и сравнения больших языковых моделей по различным метрикам производительности.