ChatGPT с заявленным интеллектом уровня PhD демонстрирует системные сбои при ответах на простые вопросы про буквы алфавита, выявляя фундаментальные ограничения архитектуры GPT-5.
OpenAI интегрирует GPT-5 в корейский мессенджер KakaoTalk с октября 2025 года. Партнерство позволит 50 млн пользователей получить доступ к последней языковой модели без отдельного приложения.
Scale запустила SEAL Showdown — первый рейтинг языковых моделей на основе оценок реальных пользователей из 100+ стран с детальной сегментацией по демографии.
Годовое исследование AAAS показало, что ChatGPT плохо справляется с суммаризацией научных статей, жертвуя точностью ради простоты и требуя такой же проверки фактов, как ручное написание.
Сравнение Perplexity и ChatGPT в 2025 году: скорость, точность и творческий потенциал двух ведущих языковых моделей с экспертным анализом сильных сторон каждой платформы.
Google Research представила TTD-DR — систему, которая моделирует написание исследовательских отчетов как диффузионный процесс, достигая новых рекордов качества.