Оглавление

Новая версия языковой модели от OpenAI демонстрирует впечатляющие результаты в точных науках. GPT-5.2 Pro и GPT-5.2 Thinking стали самыми мощными моделями компании для математических и научных работ, показывая значительный прогресс в области логического мышления и абстракции.

Рекордные показатели в тестах

На бенчмарке GPQA Diamond, который включает вопросы уровня выпускников вузов по физике, химии и биологии, GPT-5.2 Pro достиг 93,2%, а GPT-5.2 Thinking — 92,4%. В тесте FrontierMath, оценивающем экспертный уровень математики, GPT-5.2 Thinking установил новый рекорд, решив 40,3% задач.

Цифры выглядят солидно, но настоящий прорыв — в изменении подхода к научным исследованиям. Модель уже не просто заполняет пробелы в доказательствах, а самостоятельно решает открытые проблемы, что меняет саму парадигму взаимодействия человека и ИИ в науке.

Практическое применение в статистике

В исследовательской работе «О монотонности кривых обучения для оценок максимального правдоподобия» GPT-5.2 Pro помогла решить открытую проблему в теории статистического обучения. Вопрос о том, всегда ли больше данных означает лучшие результаты, долгое время оставался без ответа в базовом случае нормального распределения.

Особенность этого случая в том, что исследователи не предоставляли модели промежуточных аргументов или структуры доказательства — они напрямую попросили решить проблему, а затем тщательно проверили результат.

Новая модель научного сотрудничества

Результаты указывают на формирование нового подхода к использованию ИИ в исследованиях, особенно в областях с аксиоматическими теоретическими основами. Роль человека смещается от создания математического каркаса к верификации и интерпретации.

Ключевые аспекты работы с продвинутыми моделями:

  • Модели исследуют доказательства и проверяют гипотезы
  • Экспертная проверка остается обязательной
  • Человеческое суждение сохраняет центральную роль

Иронично, что системы, способные решать сложные математические проблемы, по-прежнему требуют человеческого контроля за их корректностью. Научный скептицизм оказался последним бастионом, не сдающимся искусственному интеллекту.

По материалам OpenAI