Модели Latent Context обещают избавить нейросети от тупика, сжимая контекст в 16 раз
Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.
27 июня 2026
Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.
Компания Anthropic столкнулась с критикой из-за ограничения мощности моделей для конкурентов и запуска сервисов, вытесняющих собственных партнеров.
GitHub внедрил экспериментальную функцию /security-review в Copilot CLI, позволяющую находить уязвимости в коде с помощью ИИ прямо в терминале.
Исследователи из Sapient представили архитектуру HRM-Text, позволившую обучить базовую модель с 1 млрд параметров всего за 1500 долларов, бросив вызов доминированию тяжелых трансформеров.
Команда Anthropic доказала, что современные ИИ-модели способны проводить реверс-инжиниринг патчей безопасности и создавать рабочие эксплойты в течение одного дня.
Google выпустила модель DiffusionGemma, использующую диффузионный метод вместо посимвольной генерации. Это позволяет обрабатывать 256 токенов параллельно и ускорять работу на GPU до 4 раз.