Reinforcement Learning with Verifiable Rewards

Исследователи предложили способ обучать LLM суммаризации процессов мышления через RLVR

Исследователи представили ReSum — метод обучения LLM самостоятельному сжатию своих мыслей для повышения точности и сокращения затрат на токены.

OpenAI и Anthropic ценовая война

OpenAI и Anthropic готовятся к ценовой войне за рынок API-токенов

OpenAI и Anthropic вступают в борьбу за корпоративных клиентов, снижая стоимость доступа к своим API на фоне подготовки к IPO.

Mod-Guide

Система Mod-Guide на базе RAG помогает ИИ понимать культурные нюансы модерации

Система Mod-Guide внедряет технологию RAG в процессы модерации контента, позволяя ИИ учитывать уникальный культурный и исторический контекст малых этнических групп.

Latent Context Language Models

Модели Latent Context обещают избавить нейросети от тупика, сжимая контекст в 16 раз

Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.

Anthropic ворует у Figma

Anthropic обвинили в том, что методы компании напоминают старые стратегии Microsoft

Компания Anthropic столкнулась с критикой из-за ограничения мощности моделей для конкурентов и запуска сервисов, вытесняющих собственных партнеров.

Security-review GitHub Copilot CLI

GitHub внедряет проверку безопасности на базе LLM прямо в консоль Copilot CLI

GitHub внедрил экспериментальную функцию /security-review в Copilot CLI, позволяющую находить уязвимости в коде с помощью ИИ прямо в терминале.