Оглавление
OpenAI наконец выпустила GPT-5 — модель, объединившую флагманскую линейку и reasoning-системы серии o. Теперь система автоматически направляет запросы либо к быстрой версии без глубоких рассуждений, либо к медленной reasoning-модели. Она доступна всем через интерфейс ChatGPT, хотя бесплатным пользователям полный функционал откроется через несколько дней.
От o1 к GPT-5: эволюция вместо революции
Сравнение с GPT-4 менее показательно, чем контраст с o1 — первой reasoning-моделью OpenAI, изначально доступной лишь подписчикам Plus и Team. Тогда пользователи получили принципиально новый ИИ, «рассуждающий» через промежуточные текстовые выводы. GPT-5 же — в первую очередь отполированный продукт.
Сэм Альтман сравнил её с Retina-дисплеями Apple, и аналогия точна: как сверхчёткий экран, модель улучшит пользовательский опыт, но не соответствует трансформационным обещаниям AGI, которые Альтман активно продвигал весь прошлый год. Его заявление, что GPT-5 — «значительный шаг к ИИ общего назначения», выглядит преувеличением: если это и шаг, то крошечный.
Демо-показ: красиво, но не ново
На предрелизной демонстрации для MIT Technology Review Ян Дюбуа (руководитель пост-обучения OpenAI) попросил GPT-5 создать веб-приложение для изучения французского.
Модель выполнила задачу безупречно, сформировав эстетичный интерфейс. Однако идентичный запрос к GPT-4o породил приложение с той же функциональностью — просто менее красивое.
Что реально улучшилось
- Автоматический роутинг избавляет пользователей от ручного выбора между reasoning/non-reasoning режимами — особенно важно для неспециалистов
- Скорость reasoning выросла, а доступность бесплатным пользователям указывает на снижение эксплуатационных затрат — ключевой фактор для уменьшения влияния ИИ на окружающую среду
- Сокращение галлюцинаций: внутренние тесты OpenAI показывают, что GPT-5 реже генерирует ложные утверждения, чем o3 и GPT-4o. Как отмечает профессор UC Berkeley Дон Сонг: «Галлюцинации создают риски безопасности — например, агент может загрузить вредоносный код из-за вымышленного пакета»
Бенчмарки и их ограничения
GPT-5 достигла state-of-the-art на SWE-Bench, Aider Polyglot и тестах агентских способностей. Но Клемантин Фурье, исследовательница HuggingFace, предупреждает: «Эти метрики близки к насыщению — как экзамены для старшеклассника по программе средней школы. Провал показателен, успех — нет». GPT-5 набрала лишь 74.9% на SWE-Bench, тогда как впечатляющим считался бы результат в 80-85%.
Ник Тарли, глава ChatGPT, резюмирует: «Вайбс этой модели отличный — обычные пользователи это оценят». Но вайбсы не приближают автоматизированное будущее, обещанное Альтманом. Reasoning в o1 казался прорывом к AGI. Следующего ждём до сих пор.
GPT-5 — важный шаг в коммерциализации ИИ, но не в науке. Автоматический роутинг и снижение галлюцинаций практичны, однако заявления OpenAI о «пути к AGI» без фундаментальных прорывов звучат как маркетинговый шум. Бенчмарки исчерпали диагностический потенциал — пора разрабатывать тесты, оценивающие креативность и адаптивность, а не шаблонные задачи. Главное достижение — доказательство, что reasoning-модели можно масштабировать для массового пользователя без катастрофических затрат. Ждём реальных инноваций, а не полировки.
Оставить комментарий