Исследование показало, что модели рассуждений не следуют инструкциям в процессе мышления
Исследование показало, что ведущие модели рассуждений нарушают пользовательские инструкции в процессе мышления в 75% случаев, особенно на сложных задачах.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Исследование показало, что ведущие модели рассуждений нарушают пользовательские инструкции в процессе мышления в 75% случаев, особенно на сложных задачах.
NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.
Alibaba обновила инструмент Qwen Deep Research, добавив возможность превращать AI-отчеты в интерактивные веб-страницы и многоголосые подкасты за 1-2 клика.
OpenAI нанимает более 100 бывших банкиров для обучения ИИ финансовому моделированию в рамках проекта «Меркурий», что может автоматизировать рутинные задачи младших аналитиков.
Искусственный интеллект учится вежливо прерывать беседы для оптимизации ресурсов и улучшения пользовательского опыта, решая проблему бесконечных диалогов.
Microsoft представила SentinelStep — технологию, которая учит ИИ-агентов терпению и стратегическому ожиданию при выполнении длительных задач мониторинга.