OpenAI представила GPT-5.5: агентные функции и цена API

OpenAI выпустила GPT-5.5 — модель с упором на автономное выполнение задач и использование инструментов. Производительность выросла, но стоимость API увеличилась вдвое.

Оглавление

Производительность и архитектурные особенности
Вариант Pro и ценовая политика

Компания OpenAI анонсировала выпуск GPT-5.5 — модели нового поколения, которую разработчики позиционируют как «новый класс интеллекта» для решения прикладных задач. Как сообщает The Decoder, ключевой особенностью новинки стала ее способность функционировать в качестве автономного агента, способного самостоятельно планировать действия и использовать внешние инструменты для достижения конечной цели.

Модель уже доступна пользователям платных планов ChatGPT и Codex, включая подписки Plus, Pro и Enterprise. Разработчики утверждают, что GPT-5.5 способна без участия человека писать и отлаживать код, проводить глубокий веб-поиск и анализировать массивы данных, переключаясь между различными программными средами до тех пор, пока поставленная задача не будет выполнена полностью.

Производительность и архитектурные особенности

В основе GPT-5.5 лежит акцент на «агентных рабочих процессах». В отличие от классических чат-ботов, эта нейросеть умеет проверять собственные результаты и итеративно исправлять ошибки. На специализированном бенчмарке Terminal-Bench 2.0 модель показала результат 82,7%, что заметно выше показателей конкурентов в лице Anthropic Claude Opus 4.7 и Google Gemini 3.1 Pro.

Особого внимания заслуживает работа с длинным контекстом. На тестах по поиску информации в документах объемом до миллиона токенов GPT-5.5 продемонстрировала качественный скачок, увеличив точность ответов с 36,6% (у версии 5.4) до впечатляющих 74,0%. Любопытно, что сама OpenAI использовала новую модель для оптимизации собственной инфраструктуры на базе NVIDIA GB200, что позволило ускорить генерацию токенов на 20%.

Бенчмарк	GPT-5.5	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82.7%	69.4%	68.5%
FrontierMath Tier 4	35.4%	22.9%	16.7%
GDPval (задачи 44 профессий)	84.9%	80.3%	67.3%

Мы видим явный прогресс в синтетических тестах на кодинг, но стагнация в реальных профессиональных задачах GDPval намекает: перед нами скорее филигранная полировка существующих алгоритмов, чем обещанная революция разума. Агентность — это удобно, пока она не начинает галлюцинировать в бесконечном цикле за ваш счет.

Вариант Pro и ценовая политика

Параллельно с базовой версией запущена GPT-5.5 Pro — модификация, ориентированная на научно-исследовательскую деятельность. Она показывает еще более высокие результаты в сложных математических вычислениях, достигая 39,6% в тесте FrontierMath Tier 4. Однако за возросшую мощь придется платить: стоимость доступа через API выросла ровно в два раза по сравнению с предыдущей версией.

Для разработчиков цена составит 5 долларов за миллион входных токенов и 30 долларов за миллион выходных. Для версии Pro тарифы еще суровее — 30 и 180 долларов соответственно. OpenAI аргументирует это тем, что модель стала эффективнее и требует меньше итераций для решения сложных проблем, что в теории должно нивелировать рост стоимости для конечного продукта.

В вопросах безопасности модель получила оценку «High» по классификации киберугроз и биологических рисков. Чтобы снизить вероятность злоупотреблений, OpenAI вводит более строгие фильтры, которые могут привести к участившимся отказам в выполнении запросов на начальном этапе. Доступ к API для широкого круга разработчиков обещают открыть в ближайшее время.

Новости

OpenAI анонсировала GPT-5.5: новая эра автономных агентов по удвоенной цене

Производительность и архитектурные особенности

Вариант Pro и ценовая политика

Еще интереснее

Стоимость генерации в GPT-5.6 может отличаться в разы из-за 3 моделей и уровней мышления

Новая GPT-5.6 Sol демонстрирует производительность Claude Fable 5 за треть от его стоимости

Meta* представила модель Muse Spark 1.1, оптимизированную под агентов

xAI представила Grok 4.5 — модель уровня GPT 5.5, но в разы дешевле

Оставить комментарий