Компания OpenAI анонсировала выпуск GPT-5.5 — модели нового поколения, которую разработчики позиционируют как «новый класс интеллекта» для решения прикладных задач. Как сообщает The Decoder, ключевой особенностью новинки стала ее способность функционировать в качестве автономного агента, способного самостоятельно планировать действия и использовать внешние инструменты для достижения конечной цели.
Модель уже доступна пользователям платных планов ChatGPT и Codex, включая подписки Plus, Pro и Enterprise. Разработчики утверждают, что GPT-5.5 способна без участия человека писать и отлаживать код, проводить глубокий веб-поиск и анализировать массивы данных, переключаясь между различными программными средами до тех пор, пока поставленная задача не будет выполнена полностью.
Производительность и архитектурные особенности
В основе GPT-5.5 лежит акцент на «агентных рабочих процессах». В отличие от классических чат-ботов, эта нейросеть умеет проверять собственные результаты и итеративно исправлять ошибки. На специализированном бенчмарке Terminal-Bench 2.0 модель показала результат 82,7%, что заметно выше показателей конкурентов в лице Anthropic Claude Opus 4.7 и Google Gemini 3.1 Pro.
Особого внимания заслуживает работа с длинным контекстом. На тестах по поиску информации в документах объемом до миллиона токенов GPT-5.5 продемонстрировала качественный скачок, увеличив точность ответов с 36,6% (у версии 5.4) до впечатляющих 74,0%. Любопытно, что сама OpenAI использовала новую модель для оптимизации собственной инфраструктуры на базе NVIDIA GB200, что позволило ускорить генерацию токенов на 20%.
| Бенчмарк | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 69.4% | 68.5% |
| FrontierMath Tier 4 | 35.4% | 22.9% | 16.7% |
| GDPval (задачи 44 профессий) | 84.9% | 80.3% | 67.3% |
Мы видим явный прогресс в синтетических тестах на кодинг, но стагнация в реальных профессиональных задачах GDPval намекает: перед нами скорее филигранная полировка существующих алгоритмов, чем обещанная революция разума. Агентность — это удобно, пока она не начинает галлюцинировать в бесконечном цикле за ваш счет.
Вариант Pro и ценовая политика
Параллельно с базовой версией запущена GPT-5.5 Pro — модификация, ориентированная на научно-исследовательскую деятельность. Она показывает еще более высокие результаты в сложных математических вычислениях, достигая 39,6% в тесте FrontierMath Tier 4. Однако за возросшую мощь придется платить: стоимость доступа через API выросла ровно в два раза по сравнению с предыдущей версией.
Для разработчиков цена составит 5 долларов за миллион входных токенов и 30 долларов за миллион выходных. Для версии Pro тарифы еще суровее — 30 и 180 долларов соответственно. OpenAI аргументирует это тем, что модель стала эффективнее и требует меньше итераций для решения сложных проблем, что в теории должно нивелировать рост стоимости для конечного продукта.
В вопросах безопасности модель получила оценку «High» по классификации киберугроз и биологических рисков. Чтобы снизить вероятность злоупотреблений, OpenAI вводит более строгие фильтры, которые могут привести к участившимся отказам в выполнении запросов на начальном этапе. Доступ к API для широкого круга разработчиков обещают открыть в ближайшее время.
Оставить комментарий