OpenAI отключила систему автоматического выбора моделей ИИ для бесплатных пользователей ChatGPT, вернувшись к единой быстрой модели. Причина — нетерпеливость пользователей и высокая стоимость «умных» моделей.
OpenAI анонсировала FrontierScience — новый комплексный бенчмарк для оценки способностей ИИ к научным рассуждениям экспертного уровня в физике, химии и биологии.
Современные ИИ-модели Gemini 3.0 Pro, GPT-5 и другие успешно проходят все три уровня сложного экзамена CFA с результатами до 97,6%
GPT-5.2 демонстрирует рекордные результаты в научных тестах и решает реальные исследовательские задачи в статистике и математике.
Google представил бенчмарк FACTS для оценки фактической точности языковых моделей. Результаты показывают, что даже лучшие модели (Gemini 3 Pro, GPT-5) не преодолевают 70% барьер, особенно в мультимодальных задачах.
Немецкая платформа недвижимости Scout24 внедряет GPT-5 для создания интеллектуального ассистента HeyImmo, который трансформирует поиск жилья через диалог и адаптивные ответы.