Оглавление

Исследователи OpenAI Себастьян Бубек и Эрнест Рю в недавнем подкасте подробно разобрали, почему именно решение сложных математических задач считается кратчайшим путем к созданию AGI (искусственного общего интеллекта). Как сообщает издание The Decoder, за последние два года нейросети совершили невероятный рывок: от простейшей арифметики начальной школы до уровня математических олимпиад и реальных научных исследований.

Еще недавно экспертное сообщество скептически относилось к способностям языковых моделей (LLM) в области точных наук. Всего полтора года назад большинство математиков на профильных конференциях считали невозможным, чтобы нейросеть могла внести вклад в решение открытых исследовательских проблем. Однако практика показала обратное: Эрнест Рю, в прошлом профессор математики в UCLA, сумел с помощью ChatGPT разрешить задачу по теории оптимизации, над которой бились 42 года, потратив на это всего три вечера.

Математика как идеальный бенчмарк

Выбор математики в качестве ключевого испытания для ИИ не случаен, так как эта дисциплина требует предельной логической связности на длинных дистанциях. В отличие от написания эссе, где небольшая стилистическая огреха не портит общего впечатления, в математическом доказательстве единственная ошибка обнуляет всю цепочку рассуждений. Система, способная выстраивать такие доказательства, неизбежно обучается находить и исправлять собственные просчеты.

Себастьян Бубек проводит аналогию с человеческим образованием: мы учим детей алгебре и геометрии не для того, чтобы они всю жизнь вычисляли интегралы, а для формирования навыка последовательного мышления. Аналогичный подход OpenAI планирует масштабировать на биологию, материаловедение и другие дисциплины. Исследователи вводят понятие «времени AGI»: если раньше модели могли имитировать ход мыслей студента в течение нескольких минут, то современные системы удерживают логическую нить днями, а в перспективе — месяцами.

LLM по-прежнему не понимает «зачем», она лишь безупречно комбинирует «как». Рыночный риск здесь заключается в создании иллюзии автономного исследователя, тогда как на деле мы получаем сверхмощный калькулятор смыслов, который без жесткого надзора человека-верификатора легко превращает научный поиск в генерацию правдоподобного мусора. Математика — это фундамент, но фундамент еще не является домом.»

Проблемы Эрдёша и новые горизонты

Особое внимание в дискуссии было уделено задачам Эрдёша — знаменитому списку открытых вопросов, оставленных венгерским математиком. Путь OpenAI в этой области начался с курьезов: после поспешных публикаций в соцсетях Бубеку пришлось уточнять, что первые «решения» были найдены моделью в существующей литературе, а не выведены с нуля. Однако ситуация быстро изменилась.

На текущий момент внутренние модели OpenAI и свежие версии ChatGPT подготовили более десяти по-настоящему новых решений, которые признаны достойными публикации в академических журналах. Это подтверждает гипотезу о том, что нейросети переходят от простой рекомбинации известных фактов к созданию нового знания. Тем не менее, ученые предупреждают о рисках «ментальной атрофии»: без глубокой экспертизы пользователя ИИ-инструменты могут стать источником ложных доказательств, которые выглядят убедительно, но лишены смысла.

Для профессионального сообщества это означает смену парадигмы. Роль исследователя смещается в сторону верификатора и стратега, который направляет диалог в нужное русло. В то время как ИИ может значительно ускорить проверку гипотез, занимавшую раньше годы, ответственность за конечный результат и его интерпретацию остается на человеке, что делает академическую подготовку критически важной даже в эпоху тотальной автоматизации.