OpenAI запустила GPT-5.5 Instant: меньше галлюцинаций

OpenAI обновила стандартную модель ChatGPT до GPT-5.5 Instant, значительно снизив уровень фактических ошибок и улучшив персонализацию ответов.

Оглавление

Точность в цифрах и на практике
Прозрачность памяти и борьба с многословием

Мир больших языковых моделей продолжает свое стремительное движение, и на этот раз OpenAI делает шаг в сторону оптимизации повседневного взаимодействия с ИИ. Как сообщает The Decoder, компания заменяет стандартную модель в ChatGPT на GPT-5.5 Instant. Это обновление нацелено на решение двух извечных проблем индустрии: склонности алгоритмов к выдумкам и избыточного многословия, которое часто мешает продуктивной работе.

Новая итерация приходит на смену версии 5.3 Instant и уже доступна через API под идентификатором chat-latest. Разработчики утверждают, что в ходе внутреннего тестирования GPT-5.5 Instant продемонстрировала снижение уровня галлюцинаций на 52,5% при работе с темами высокого риска, такими как медицина, юриспруденция и финансы. Для тех, кто привык использовать чат-бота как справочный инструмент, это довольно весомый аргумент, хотя скептицизм относительно полной достоверности ответов все же стоит сохранять.

Точность в цифрах и на практике

Улучшения подтверждаются не только внутренними отчетами, но и академическими бенчмарками. В тесте GPQA, который проверяет научные знания на уровне доктора наук, точность модели выросла с 78,5 до 85,6%. В области соревновательной математики (AIME 2025) скачок еще более заметен: результат поднялся с 65,4 до 81,2%. Кажется, ИИ наконец-то начинает лучше справляться с логическими цепочками, где раньше спотыкался на элементарных этапах перегруппировки уравнений.

Любопытно выглядит пример, приведенный OpenAI: если раньше модель могла согласиться с неверным решением пользователя в алгебраической задаче, то GPT-5.5 Instant теперь способна распознать ошибку в рассуждениях человека и предложить корректный путь. Это напоминает работу внимательного редактора, который не просто поддакивает, а действительно вникает в контекст. Ошибки при парсинге сложных документов в тесте OmniDocBench также сократились, достигнув отметки в 12,5%.

Бенчмарк	Описание теста	GPT-5.3 Instant	GPT-5.5 Instant
GPQA	Наука (PhD уровень)	78,5%	85,6%
AIME 2025	Сложная математика	65,4%	81,2%
CharXiv	Анализ графиков	75,0%	81,6%

Прозрачность памяти и борьба с многословием

Одним из ключевых нововведений стала функция memory sources (источники памяти). Теперь пользователь может видеть, какие именно данные — прошлые диалоги, загруженные файлы или заметки — сформировали конкретный ответ. Это важный шаг к демистификации работы ИИ: система позволяет редактировать или удалять отдельные записи из своего «архива», давая человеку больше контроля над тем, что модель «помнит» о нем.

Кроме того, OpenAI поработала над стилистикой ответов. В компании признают, что пользователи устали от лишних вводных фраз, бесконечных списков эмодзи и чрезмерного форматирования. Новая модель стремится к лаконичности, стараясь выдавать суть без потери качества. Она также лучше определяет, когда действительно стоит использовать личный контекст из Gmail или прошлых чатов, а когда лучше придерживаться общих фактов.

Мы видим качественную оптимизацию весов, но архитектурный потолок ‘инстант-моделей’ всё еще ощутим в задачах, требующих глубокой рефлексии. Ирония в том, что пока OpenAI борется за лаконичность, реальная ценность смещается в сторону ‘тяжелых’ моделей Thinking, оставляя Instant роль продвинутого Т9 для корпоративной переписки.

Развертывание GPT-5.5 Instant уже началось для всех категорий пользователей. Подписчики платных планов Plus и Pro получили приоритетный доступ к расширенной персонализации через интеграцию с файлами и почтой, в то время как пользователи бесплатных версий увидят эти функции в ближайшие недели. При этом старая версия 5.3 останется доступной в настройках для платных аккаунтов еще на три месяца, прежде чем окончательно уйдет на покой.

Важно отметить, что GPT-5.5 Instant позиционируется как модель для повседневных задач, в то время как для сложного программирования или глубокого анализа OpenAI предлагает использовать GPT-5.5 Thinking. Последняя, по данным независимых тестов Института безопасности ИИ Великобритании, уже конкурирует с топовыми решениями вроде Claude Mythos, подтверждая, что эпоха универсальных моделей постепенно сменяется эрой специализированных инструментов под конкретные нужды.

Новости

В ChatGPT обновилась базовая модель: GPT-5.5 Instant обещает меньше галлюцинаций и больше конкретики

Точность в цифрах и на практике

Прозрачность памяти и борьба с многословием

Еще интереснее

NVIDIA открывает DFlash: новый подход к ускорению вывода языковых моделей

Liquid AI выпускает модель LFM2.5-230M с результатами на уровне моделей в 4 раза больше

Google переводит Gemini на Interactions API: новая архитектура для эпохи агентов

OpenAI может выпустить новую модель GPT-5.6 уже до конца июня

Оставить комментарий