LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Обучение на плохих данных

Исследование показывает, что обучение на плохих данных ухудшает способности LLM

Исследование показало, что обучение языковых моделей на низкокачественных данных ухудшает их способности к рассуждению и работе с длинным контекстом.

Игровая зависимость LLM

Исследование выявило признаки игровой зависимости у языковых моделей

Языковые модели ИИ демонстрируют признаки игровой зависимости в симуляциях, принимая иррациональные решения и доводя себя до банкротства, подобно человеческим аддиктам.

Isaacus представил Kanon 2 Embedder

Австралийская языковая модель превзошла OpenAI и Google в юридическом поиске

Австралийский стартап Isaacus представил Kanon 2 Embedder — юридическую модель, превосходящую OpenAI и Google по точности поиска и скорости работы.

Модели рассуждений не следуют инструкциям

Исследование показало, что модели рассуждений не следуют инструкциям в процессе мышления

Исследование показало, что ведущие модели рассуждений нарушают пользовательские инструкции в процессе мышления в 75% случаев, особенно на сложных задачах.

NVIDIA выпускает Nemotron-8B-Embed

NVIDIA выпускает Nemotron-8B-Embed модель для генерации векторных представлений

NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.

Qwen Deep Research

Qwen Deep Research теперь генерирует веб-страницы и подкасты из отчетов ИИ

Alibaba обновила инструмент Qwen Deep Research, добавив возможность превращать AI-отчеты в интерактивные веб-страницы и многоголосые подкасты за 1-2 клика.