Оглавление

Профессор Эрнест Рю из Калифорнийского университета в Лос-Анджелесе использовал языковую модель GPT-5 для решения математической проблемы, которая оставалась нерешенной на протяжении четырех десятилетий. Речь идет о фундаментальном вопросе в теории оптимизации, связанном с методом ускоренного градиента Нестерова.

Проблема и её значение

Метод ускоренного градиента Нестерова (NAG) был впервые представлен в 1983 году математиком Юрием Нестеровым и представляет собой оптимизационный метод, использующий форму предсказания — часто описываемую как «заглядывание вперед» — для ускорения сходимости алгоритмов.

Основная загадка заключалась в том, почему увеличение импульса алгоритма не влияет существенно на его стабильность. В обучении моделей машинного обучения или решении инженерных задач эффективность критически важна для избежания потерь вычислительных ресурсов и получения более быстрых результатов.

«Расширяя теоретический инструментарий в теории оптимизации, мы коллективно разрабатываем алгоритмы, оптимизированные для эффективности, стабильности и безопасности», — отметил Рю.

Исследование проблемы с GPT-5

Рю начал экспериментировать с GPT-5 после того, как услышал о его продвинутых возможностях в математике. Изначально он тестировал ChatGPT-3.5 еще в 2023 году, но тогда модель демонстрировала ограниченные способности в решении математических и логических задач.

«У него был интересный подход, о котором я не думал», — сказал профессор о GPT-5. Именно это побудило его продолжить исследование.

В процессе работы GPT-5 не изобретал новые математические инструменты и принципы, но оказался весьма эффективен в использовании существующих инструментов и нахождении уравнений, решений и идей из статей, немного выходящих за пределы данной области знаний.

«Он поразил меня странными вещами, которые пытался сделать. Его способность черпать из этого масштабного объема чтения и обучения — вот что делает его действительно мощным».

Ключевой прорыв

Переломный момент наступил, когда модель предложила способ переструктурирования уравнений, управляющих методом NAG. Предложение не было корректным в изначальной формулировке, но Рю распознал структурную особенность, которая казалась значимой, разработал ее более строго самостоятельно и начал задавать модели целевые вопросы для проверки жизнеспособности потенциального доказательства.

«Это было сюрреалистическое чувство», — поделился профессор, сравнив опыт с работой с компетентным студентом, который придумывает идеи, задает вопросы и проводит мозговой штурм.

Процесс занял около двенадцати часов за три дня сотрудничества с GPT-5. После почти дюжины подходов один из исследуемых методов наконец сработал.

Это классический пример того, как ИИ становится не заменой человеческого интеллекта, а его усилителем. GPT-5 здесь выступает в роли сверхбыстрого ассистента, способного перелопатить гигантские объемы математической литературы и предложить неочевидные связи. Правда, без экспертной проверки все эти «инсайты» так и остались бы просто красивыми гипотезами — что и демонстрирует важность симбиоза человека и машины в научных исследованиях.

Ограничения и возможности

Хотя процесс был значительно быстрее, он также требовал тщательной проверки. GPT-5 часто производил аргументы, которые выглядели правдоподобно, но не выдерживали проверки при детальном анализе.

Рю подчеркивает, что математическая интуиция человека остается критически важной: «То, как работает математическое исследование, заключается в том, что у вас есть идеи, и всякий раз, когда вы или ваши коллеги придумываете грубую идею, у вас есть ощущение, сработает она или нет. Вот где партнерство между искусственным интеллектом и людьми может работать особенно хорошо».

Этот случай демонстрирует потенциал больших языковых моделей как инструментов исследования, когда они объединяются с предметной экспертизой и тщательной проверкой.

По материалам OpenAI.