GPT-5.2 прорыв в бизнес-задачах и программировании

OpenAI выпустила GPT-5.2 с фокусом на сложные бизнес-задачи и программирование. Модель показывает значительный прогресс в аналитических задачах, но остается медленной для повседневного использования.

Оглавление

Искусственный интеллект как серьезный аналитик
Корпоративные преимущества: значительный рост производительности
Серьезный прорыв в программировании и симуляциях
Эра агентов: длительная автономная работа
Недостатки: скорость и жесткость
Вердикт

Как сообщает VentureBeat, OpenAI официально выпустила GPT-5.2, и первые отзывы от тестировщиков рисуют двойственную картину: модель представляет собой монументальный скачок в сложных рассуждениях и программировании, но может показаться лишь инкрементальным обновлением для повседневного общения.

Искусственный интеллект как серьезный аналитик

Самые восторженные отзывы о GPT-5.2 касаются ее способности решать «сложные проблемы», требующие длительного времени на обдумывание.

Мэтт Шумер, CEO HyperWriteAI, в своем обзоре назвал GPT-5.2 Pro «лучшей моделью в мире». Он подчеркнул упорство модели, отметив, что «она думает более часа над сложными задачами. И справляется с заданиями, которые не под силу другим моделям».

Этот подход поддержала Элли К. Миллер, предприниматель в области ИИ и бывший исполнительный директор AWS. Миллер описала модель как шаг к «ИИ как серьезному аналитику», а не «дружелюбному компаньону».

«Мышление и решение задач ощутимо усилились», — написала Миллер в X. «Она дает гораздо более глубокие объяснения, чем я привыкла видеть. В какой-то момент она буквально написала код для улучшения собственного оптического распознавания символов в процессе выполнения задачи».

Корпоративные преимущества: значительный рост производительности

Для корпоративного сектора обновление выглядит еще более значительным.

Аарон Леви, CEO Box, сообщил, что его компания тестировала GPT-5.2 в раннем доступе. Леви отметил, что модель показывает «на 7 баллов лучше, чем GPT-5.1» в расширенных тестах на рассуждение, которые приближены к реальной интеллектуальной работе в финансовых услугах и науках о жизни.

«Модель выполнила большинство задач гораздо быстрее, чем GPT-5.1 и GPT-5», — констатировал Леви, подтвердив, что интеграция с Box AI будет запущена в ближайшее время.

Рутуджа Райваде, старший менеджер по продуктовому маркетингу в Box, указала конкретные улучшения задержек. Задачи «сложного извлечения» сократились с 46 секунд на GPT-5 до всего 12 секунд с новой моделью. Райваде также отметила скачок в возможностях рассуждения для вертикали медиа и развлечений — с 76% точности в GPT-5.1 до 81% в новой модели.

Серьезный прорыв в программировании и симуляциях

Разработчики находят GPT-5.2 особенно эффективной для «одноразовой» генерации сложных структур кода.

Пьетро Ширано, CEO magicpathai, опубликовал видео модели, создающей полноценный 3D-графический движок в одном файле с интерактивными элементами управления. «Это серьезный скачок вперед в сложных рассуждениях, математике, программировании и симуляциях», — написал Ширано. «Темпы прогресса нереальны».

Точно так же Итан Моллик, профессор Уортонской школы бизнеса Пенсильванского университета, продемонстрировал способность модели создавать визуально сложный шейдер — бесконечный неоготический город в бушующем океане — с помощью одного промпта.

Эра агентов: длительная автономная работа

Возможно, самый функциональный сдвиг — это способность модели оставаться в задаче часами, не теряя нить.

Дэн Шиппер, CEO рассылки Every, сообщил, что модель успешно выполнила анализ прибылей и убытков, требовавший автономной работы в течение двух часов. «Она провела анализ P&L, работая 2 часа и дав отличные результаты», — написал Шиппер.

Однако Шиппер также отметил, что для повседневных задач обновление ощущается «в основном инкрементальным».

В статье для Every Кэти Пэрротт написала, что хотя GPT-5.2 превосходно выполняет инструкции, она «менее находчива», чем конкуренты вроде Claude Opus 4.5 в определенных контекстах, например при определении местоположения пользователя по данным электронной почты.

Недостатки: скорость и жесткость

Несмотря на возможности рассуждения, «ощущение» от модели вызвало критику.

Шумер выделил значительный «штраф за скорость» при использовании режима Thinking. «По моему опыту, режим Thinking очень медленный для большинства вопросов», — написал Шумер в своем глубоком обзоре. «Я почти никогда не использую Instant».

Элли Миллер также указала на проблемы с поведением модели по умолчанию. «Недостаток в тоне и формате», — отметила она. «Голос по умолчанию ощущался несколько более жестким, а поведение длины/разметки экстремальное: простой вопрос превратился в 58 пунктов и нумерованных списков».

Пока одни разработчики восхищаются способностью GPT-5.2 часами решать аналитические задачи, возникает вопрос: насколько такой подход масштабируем в реальных бизнес-процессах? Увеличение времени выполнения с 46 до 12 секунд — впечатляет, но в эпоху, когда скорость имеет значение, двухчасовые размышления над P&L-анализом выглядят скорее академическим достижением, чем практическим прорывом. Ирония в том, что модель, создающая неоготические города в океане, может быть слишком медленной для ответа на простой вопрос.

Вердикт

Первые реакции предполагают, что GPT-5.2 — это инструмент, оптимизированный для опытных пользователей, разработчиков и корпоративных агентов, а не для повседневного чата. Как подвел итог Шумер в своем обзоре: «Для глубоких исследований, сложных рассуждений и задач, выигрывающих от вдумчивого подхода, GPT-5.2 Pro — лучший доступный вариант».

Однако для пользователей, ищущих творческое письмо или быстрые, плавные ответы, модели вроде Claude Opus 4.5 остаются сильными конкурентами. «Моя любимая модель остается Claude Opus 4.5», — признала Миллер, — «но моя сложная работа в ChatGPT получит приятное инкрементальное улучшение».

Новости

Новая модель GPT-5.2 демонстрирует прорыв в сложных бизнес-задачах и программировании

Искусственный интеллект как серьезный аналитик

Корпоративные преимущества: значительный рост производительности

Серьезный прорыв в программировании и симуляциях

Эра агентов: длительная автономная работа

Недостатки: скорость и жесткость

Вердикт

Еще интереснее

Xiaomi выпустила MiMo-V2-Pro — недорогую ИИ-модель на 1 трлн параметров

Nvidia представила технологию KVTC с 20-кратным сжатием памяти для открытых LLM

Японская корпорация Rakuten выпустила новую модель Rakuten AI 3.0 под открытой лицензией

Perplexity запускает интеллектуальный маршрутизатор — систему Computer for Enterprise

Оставить комментарий