GPT-5 выпущен OpenAI: обзор возможностей и критики

OpenAI выпустила GPT-5, объединившую reasoning и обычные модели. Улучшения — в UX и снижении галлюцинаций, но технологически это эволюция, а не прорыв к AGI.

Оглавление

От o1 к GPT-5: эволюция вместо революции
Демо-показ: красиво, но не ново
Что реально улучшилось
Бенчмарки и их ограничения

OpenAI наконец выпустила GPT-5 — модель, объединившую флагманскую линейку и reasoning-системы серии o. Теперь система автоматически направляет запросы либо к быстрой версии без глубоких рассуждений, либо к медленной reasoning-модели. Она доступна всем через интерфейс ChatGPT, хотя бесплатным пользователям полный функционал откроется через несколько дней.

От o1 к GPT-5: эволюция вместо революции

Сравнение с GPT-4 менее показательно, чем контраст с o1 — первой reasoning-моделью OpenAI, изначально доступной лишь подписчикам Plus и Team. Тогда пользователи получили принципиально новый ИИ, «рассуждающий» через промежуточные текстовые выводы. GPT-5 же — в первую очередь отполированный продукт.

Сэм Альтман сравнил её с Retina-дисплеями Apple, и аналогия точна: как сверхчёткий экран, модель улучшит пользовательский опыт, но не соответствует трансформационным обещаниям AGI, которые Альтман активно продвигал весь прошлый год. Его заявление, что GPT-5 — «значительный шаг к ИИ общего назначения», выглядит преувеличением: если это и шаг, то крошечный.

Демо-показ: красиво, но не ново

На предрелизной демонстрации для MIT Technology Review Ян Дюбуа (руководитель пост-обучения OpenAI) попросил GPT-5 создать веб-приложение для изучения французского.

Модель выполнила задачу безупречно, сформировав эстетичный интерфейс. Однако идентичный запрос к GPT-4o породил приложение с той же функциональностью — просто менее красивое.

Что реально улучшилось

Автоматический роутинг избавляет пользователей от ручного выбора между reasoning/non-reasoning режимами — особенно важно для неспециалистов
Скорость reasoning выросла, а доступность бесплатным пользователям указывает на снижение эксплуатационных затрат — ключевой фактор для уменьшения влияния ИИ на окружающую среду
Сокращение галлюцинаций: внутренние тесты OpenAI показывают, что GPT-5 реже генерирует ложные утверждения, чем o3 и GPT-4o. Как отмечает профессор UC Berkeley Дон Сонг: «Галлюцинации создают риски безопасности — например, агент может загрузить вредоносный код из-за вымышленного пакета»

Бенчмарки и их ограничения

GPT-5 достигла state-of-the-art на SWE-Bench, Aider Polyglot и тестах агентских способностей. Но Клемантин Фурье, исследовательница HuggingFace, предупреждает: «Эти метрики близки к насыщению — как экзамены для старшеклассника по программе средней школы. Провал показателен, успех — нет». GPT-5 набрала лишь 74.9% на SWE-Bench, тогда как впечатляющим считался бы результат в 80-85%.

Ник Тарли, глава ChatGPT, резюмирует: «Вайбс этой модели отличный — обычные пользователи это оценят». Но вайбсы не приближают автоматизированное будущее, обещанное Альтманом. Reasoning в o1 казался прорывом к AGI. Следующего ждём до сих пор.

GPT-5 — важный шаг в коммерциализации ИИ, но не в науке. Автоматический роутинг и снижение галлюцинаций практичны, однако заявления OpenAI о «пути к AGI» без фундаментальных прорывов звучат как маркетинговый шум. Бенчмарки исчерпали диагностический потенциал — пора разрабатывать тесты, оценивающие креативность и адаптивность, а не шаблонные задачи. Главное достижение — доказательство, что reasoning-модели можно масштабировать для массового пользователя без катастрофических затрат. Ждём реальных инноваций, а не полировки.

Новости

GPT-5 уже здесь. Первые впечатления.

От o1 к GPT-5: эволюция вместо революции

Демо-показ: красиво, но не ново

Что реально улучшилось

Бенчмарки и их ограничения

Еще интереснее

В Google придумали, обновлять убеждения LLM при получении новой информации

OpenAI представила GPT-5.4: агентная автономность и прямой контроль интерфейсов

Институт Аллена выпустил новую версию гибридной модели Olmo Hybrid 7B

ИИ от Meta* не ограничивается только Llama: что известно про проекты Mango и Avocado

Оставить комментарий