Мир больших языковых моделей продолжает свое стремительное движение, и на этот раз OpenAI делает шаг в сторону оптимизации повседневного взаимодействия с ИИ. Как сообщает The Decoder, компания заменяет стандартную модель в ChatGPT на GPT-5.5 Instant. Это обновление нацелено на решение двух извечных проблем индустрии: склонности алгоритмов к выдумкам и избыточного многословия, которое часто мешает продуктивной работе.
Новая итерация приходит на смену версии 5.3 Instant и уже доступна через API под идентификатором chat-latest. Разработчики утверждают, что в ходе внутреннего тестирования GPT-5.5 Instant продемонстрировала снижение уровня галлюцинаций на 52,5% при работе с темами высокого риска, такими как медицина, юриспруденция и финансы. Для тех, кто привык использовать чат-бота как справочный инструмент, это довольно весомый аргумент, хотя скептицизм относительно полной достоверности ответов все же стоит сохранять.
Точность в цифрах и на практике
Улучшения подтверждаются не только внутренними отчетами, но и академическими бенчмарками. В тесте GPQA, который проверяет научные знания на уровне доктора наук, точность модели выросла с 78,5 до 85,6%. В области соревновательной математики (AIME 2025) скачок еще более заметен: результат поднялся с 65,4 до 81,2%. Кажется, ИИ наконец-то начинает лучше справляться с логическими цепочками, где раньше спотыкался на элементарных этапах перегруппировки уравнений.
Любопытно выглядит пример, приведенный OpenAI: если раньше модель могла согласиться с неверным решением пользователя в алгебраической задаче, то GPT-5.5 Instant теперь способна распознать ошибку в рассуждениях человека и предложить корректный путь. Это напоминает работу внимательного редактора, который не просто поддакивает, а действительно вникает в контекст. Ошибки при парсинге сложных документов в тесте OmniDocBench также сократились, достигнув отметки в 12,5%.
| Бенчмарк | Описание теста | GPT-5.3 Instant | GPT-5.5 Instant |
|---|---|---|---|
| GPQA | Наука (PhD уровень) | 78,5% | 85,6% |
| AIME 2025 | Сложная математика | 65,4% | 81,2% |
| CharXiv | Анализ графиков | 75,0% | 81,6% |
Прозрачность памяти и борьба с многословием
Одним из ключевых нововведений стала функция memory sources (источники памяти). Теперь пользователь может видеть, какие именно данные — прошлые диалоги, загруженные файлы или заметки — сформировали конкретный ответ. Это важный шаг к демистификации работы ИИ: система позволяет редактировать или удалять отдельные записи из своего «архива», давая человеку больше контроля над тем, что модель «помнит» о нем.
Кроме того, OpenAI поработала над стилистикой ответов. В компании признают, что пользователи устали от лишних вводных фраз, бесконечных списков эмодзи и чрезмерного форматирования. Новая модель стремится к лаконичности, стараясь выдавать суть без потери качества. Она также лучше определяет, когда действительно стоит использовать личный контекст из Gmail или прошлых чатов, а когда лучше придерживаться общих фактов.
Мы видим качественную оптимизацию весов, но архитектурный потолок ‘инстант-моделей’ всё еще ощутим в задачах, требующих глубокой рефлексии. Ирония в том, что пока OpenAI борется за лаконичность, реальная ценность смещается в сторону ‘тяжелых’ моделей Thinking, оставляя Instant роль продвинутого Т9 для корпоративной переписки.
Развертывание GPT-5.5 Instant уже началось для всех категорий пользователей. Подписчики платных планов Plus и Pro получили приоритетный доступ к расширенной персонализации через интеграцию с файлами и почтой, в то время как пользователи бесплатных версий увидят эти функции в ближайшие недели. При этом старая версия 5.3 останется доступной в настройках для платных аккаунтов еще на три месяца, прежде чем окончательно уйдет на покой.
Важно отметить, что GPT-5.5 Instant позиционируется как модель для повседневных задач, в то время как для сложного программирования или глубокого анализа OpenAI предлагает использовать GPT-5.5 Thinking. Последняя, по данным независимых тестов Института безопасности ИИ Великобритании, уже конкурирует с топовыми решениями вроде Claude Mythos, подтверждая, что эпоха универсальных моделей постепенно сменяется эрой специализированных инструментов под конкретные нужды.
Оставить комментарий