Исследование показывает, что обучение на плохих данных ухудшает способности LLM
Исследование показало, что обучение языковых моделей на низкокачественных данных ухудшает их способности к рассуждению и работе с длинным контекстом.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Исследование показало, что обучение языковых моделей на низкокачественных данных ухудшает их способности к рассуждению и работе с длинным контекстом.
Языковые модели ИИ демонстрируют признаки игровой зависимости в симуляциях, принимая иррациональные решения и доводя себя до банкротства, подобно человеческим аддиктам.
Австралийский стартап Isaacus представил Kanon 2 Embedder — юридическую модель, превосходящую OpenAI и Google по точности поиска и скорости работы.
Исследование показало, что ведущие модели рассуждений нарушают пользовательские инструкции в процессе мышления в 75% случаев, особенно на сложных задачах.
NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.
Alibaba обновила инструмент Qwen Deep Research, добавив возможность превращать AI-отчеты в интерактивные веб-страницы и многоголосые подкасты за 1-2 клика.