Оглавление

Компания OpenAI анонсировала выпуск GPT-5.5 — модели нового поколения, которую разработчики позиционируют как «новый класс интеллекта» для решения прикладных задач. Как сообщает The Decoder, ключевой особенностью новинки стала ее способность функционировать в качестве автономного агента, способного самостоятельно планировать действия и использовать внешние инструменты для достижения конечной цели.

Модель уже доступна пользователям платных планов ChatGPT и Codex, включая подписки Plus, Pro и Enterprise. Разработчики утверждают, что GPT-5.5 способна без участия человека писать и отлаживать код, проводить глубокий веб-поиск и анализировать массивы данных, переключаясь между различными программными средами до тех пор, пока поставленная задача не будет выполнена полностью.

Производительность и архитектурные особенности

В основе GPT-5.5 лежит акцент на «агентных рабочих процессах». В отличие от классических чат-ботов, эта нейросеть умеет проверять собственные результаты и итеративно исправлять ошибки. На специализированном бенчмарке Terminal-Bench 2.0 модель показала результат 82,7%, что заметно выше показателей конкурентов в лице Anthropic Claude Opus 4.7 и Google Gemini 3.1 Pro.

Особого внимания заслуживает работа с длинным контекстом. На тестах по поиску информации в документах объемом до миллиона токенов GPT-5.5 продемонстрировала качественный скачок, увеличив точность ответов с 36,6% (у версии 5.4) до впечатляющих 74,0%. Любопытно, что сама OpenAI использовала новую модель для оптимизации собственной инфраструктуры на базе NVIDIA GB200, что позволило ускорить генерацию токенов на 20%.

Бенчмарк GPT-5.5 Claude Opus 4.7 Gemini 3.1 Pro
Terminal-Bench 2.0 82.7% 69.4% 68.5%
FrontierMath Tier 4 35.4% 22.9% 16.7%
GDPval (задачи 44 профессий) 84.9% 80.3% 67.3%

Мы видим явный прогресс в синтетических тестах на кодинг, но стагнация в реальных профессиональных задачах GDPval намекает: перед нами скорее филигранная полировка существующих алгоритмов, чем обещанная революция разума. Агентность — это удобно, пока она не начинает галлюцинировать в бесконечном цикле за ваш счет.

Вариант Pro и ценовая политика

Параллельно с базовой версией запущена GPT-5.5 Pro — модификация, ориентированная на научно-исследовательскую деятельность. Она показывает еще более высокие результаты в сложных математических вычислениях, достигая 39,6% в тесте FrontierMath Tier 4. Однако за возросшую мощь придется платить: стоимость доступа через API выросла ровно в два раза по сравнению с предыдущей версией.

Для разработчиков цена составит 5 долларов за миллион входных токенов и 30 долларов за миллион выходных. Для версии Pro тарифы еще суровее — 30 и 180 долларов соответственно. OpenAI аргументирует это тем, что модель стала эффективнее и требует меньше итераций для решения сложных проблем, что в теории должно нивелировать рост стоимости для конечного продукта.

В вопросах безопасности модель получила оценку «High» по классификации киберугроз и биологических рисков. Чтобы снизить вероятность злоупотреблений, OpenAI вводит более строгие фильтры, которые могут привести к участившимся отказам в выполнении запросов на начальном этапе. Доступ к API для широкого круга разработчиков обещают открыть в ближайшее время.