LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Модели рассуждений не следуют инструкциям

Исследование показало, что модели рассуждений не следуют инструкциям в процессе мышления

Исследование показало, что ведущие модели рассуждений нарушают пользовательские инструкции в процессе мышления в 75% случаев, особенно на сложных задачах.

NVIDIA выпускает Nemotron-8B-Embed

NVIDIA выпускает Nemotron-8B-Embed модель для генерации векторных представлений

NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.

Qwen Deep Research

Qwen Deep Research теперь генерирует веб-страницы и подкасты из отчетов ИИ

Alibaba обновила инструмент Qwen Deep Research, добавив возможность превращать AI-отчеты в интерактивные веб-страницы и многоголосые подкасты за 1-2 клика.

OpenAI нанимает бывших банкиров

OpenAI нанимает бывших банкиров для обучения ИИ финансовому моделированию

OpenAI нанимает более 100 бывших банкиров для обучения ИИ финансовому моделированию в рамках проекта «Меркурий», что может автоматизировать рутинные задачи младших аналитиков.

ИИ должен прерывать беседу

Почему ИИ должен уметь вежливо прерывать беседу

Искусственный интеллект учится вежливо прерывать беседы для оптимизации ресурсов и улучшения пользовательского опыта, решая проблему бесконечных диалогов.

SentinelStep

Microsoft учит ИИ-агентов терпению с помощью технологии SentinelStep

Microsoft представила SentinelStep — технологию, которая учит ИИ-агентов терпению и стратегическому ожиданию при выполнении длительных задач мониторинга.