Скандал в OpenAI: GPT-5 не решил задачи Эрдёша, а просто нашел ответы в интернете
Исследователь OpenAI заявил о решении задач Эрдёша с помощью GPT-5, но оказалось, что система просто нашла готовые ответы в интернете.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Исследователь OpenAI заявил о решении задач Эрдёша с помощью GPT-5, но оказалось, что система просто нашла готовые ответы в интернете.
Anthropic представила специализированное решение Claude для наук о жизни с интеграциями научных платформ, улучшенными показателями в биомедицинских задачах и партнерствами с ведущими консалтинговыми компаниями.
Фреймворк SwiReasoning от Georgia Tech и Microsoft учит языковые модели переключаться между явными и скрытыми режимами рассуждения, повышая точность на 2,8% и эффективность токенов в 6,8 раз.
Сооснователь OpenAI Андрей Карпатый считает, что создание полноценных ИИ-агентов займет около десяти лет из-за фундаментальных ограничений текущих технологий.
OpenAI переживает кризис: рост ChatGPT замедляется, GPT-5 обвиняют в преувеличении возможностей, а разрешение эротического контента вызывает споры о стратегии компании.
Google объединила Gemini CLI с GKE для автоматизации развертывания языковых моделей. Инструмент предоставляет рекомендации по оптимизации затрат и производительности LLM-рабочих нагрузок.