Оглавление

Мир больших языковых моделей продолжает свое стремительное движение, и на этот раз OpenAI делает шаг в сторону оптимизации повседневного взаимодействия с ИИ. Как сообщает The Decoder, компания заменяет стандартную модель в ChatGPT на GPT-5.5 Instant. Это обновление нацелено на решение двух извечных проблем индустрии: склонности алгоритмов к выдумкам и избыточного многословия, которое часто мешает продуктивной работе.

Новая итерация приходит на смену версии 5.3 Instant и уже доступна через API под идентификатором chat-latest. Разработчики утверждают, что в ходе внутреннего тестирования GPT-5.5 Instant продемонстрировала снижение уровня галлюцинаций на 52,5% при работе с темами высокого риска, такими как медицина, юриспруденция и финансы. Для тех, кто привык использовать чат-бота как справочный инструмент, это довольно весомый аргумент, хотя скептицизм относительно полной достоверности ответов все же стоит сохранять.

Точность в цифрах и на практике

Улучшения подтверждаются не только внутренними отчетами, но и академическими бенчмарками. В тесте GPQA, который проверяет научные знания на уровне доктора наук, точность модели выросла с 78,5 до 85,6%. В области соревновательной математики (AIME 2025) скачок еще более заметен: результат поднялся с 65,4 до 81,2%. Кажется, ИИ наконец-то начинает лучше справляться с логическими цепочками, где раньше спотыкался на элементарных этапах перегруппировки уравнений.

Любопытно выглядит пример, приведенный OpenAI: если раньше модель могла согласиться с неверным решением пользователя в алгебраической задаче, то GPT-5.5 Instant теперь способна распознать ошибку в рассуждениях человека и предложить корректный путь. Это напоминает работу внимательного редактора, который не просто поддакивает, а действительно вникает в контекст. Ошибки при парсинге сложных документов в тесте OmniDocBench также сократились, достигнув отметки в 12,5%.

Бенчмарк Описание теста GPT-5.3 Instant GPT-5.5 Instant
GPQA Наука (PhD уровень) 78,5% 85,6%
AIME 2025 Сложная математика 65,4% 81,2%
CharXiv Анализ графиков 75,0% 81,6%

Прозрачность памяти и борьба с многословием

Одним из ключевых нововведений стала функция memory sources (источники памяти). Теперь пользователь может видеть, какие именно данные — прошлые диалоги, загруженные файлы или заметки — сформировали конкретный ответ. Это важный шаг к демистификации работы ИИ: система позволяет редактировать или удалять отдельные записи из своего «архива», давая человеку больше контроля над тем, что модель «помнит» о нем.

Кроме того, OpenAI поработала над стилистикой ответов. В компании признают, что пользователи устали от лишних вводных фраз, бесконечных списков эмодзи и чрезмерного форматирования. Новая модель стремится к лаконичности, стараясь выдавать суть без потери качества. Она также лучше определяет, когда действительно стоит использовать личный контекст из Gmail или прошлых чатов, а когда лучше придерживаться общих фактов.

Мы видим качественную оптимизацию весов, но архитектурный потолок ‘инстант-моделей’ всё еще ощутим в задачах, требующих глубокой рефлексии. Ирония в том, что пока OpenAI борется за лаконичность, реальная ценность смещается в сторону ‘тяжелых’ моделей Thinking, оставляя Instant роль продвинутого Т9 для корпоративной переписки.

Развертывание GPT-5.5 Instant уже началось для всех категорий пользователей. Подписчики платных планов Plus и Pro получили приоритетный доступ к расширенной персонализации через интеграцию с файлами и почтой, в то время как пользователи бесплатных версий увидят эти функции в ближайшие недели. При этом старая версия 5.3 останется доступной в настройках для платных аккаунтов еще на три месяца, прежде чем окончательно уйдет на покой.

Важно отметить, что GPT-5.5 Instant позиционируется как модель для повседневных задач, в то время как для сложного программирования или глубокого анализа OpenAI предлагает использовать GPT-5.5 Thinking. Последняя, по данным независимых тестов Института безопасности ИИ Великобритании, уже конкурирует с топовыми решениями вроде Claude Mythos, подтверждая, что эпоха универсальных моделей постепенно сменяется эрой специализированных инструментов под конкретные нужды.