Latent Context Language Models

Модели Latent Context обещают избавить нейросети от тупика, сжимая контекст в 16 раз

Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.

Anthropic ворует у Figma

Anthropic обвинили в том, что методы компании напоминают старые стратегии Microsoft

Компания Anthropic столкнулась с критикой из-за ограничения мощности моделей для конкурентов и запуска сервисов, вытесняющих собственных партнеров.

Security-review GitHub Copilot CLI

GitHub внедряет проверку безопасности на базе LLM прямо в консоль Copilot CLI

GitHub внедрил экспериментальную функцию /security-review в Copilot CLI, позволяющую находить уязвимости в коде с помощью ИИ прямо в терминале.

Sapient обучили HRM-Text

Разработчики из Sapient смогли обучить базовую ИИ-модель всего за $1500

Исследователи из Sapient представили архитектуру HRM-Text, позволившую обучить базовую модель с 1 млрд параметров всего за 1500 долларов, бросив вызов доминированию тяжелых трансформеров.

Mythos взламывает патчи

Модель Mythos доказала, что ИИ способен взламывать патчи безопасности за считанные часы

Команда Anthropic доказала, что современные ИИ-модели способны проводить реверс-инжиниринг патчей безопасности и создавать рабочие эксплойты в течение одного дня.

DiffusionGemm от Google

Вышла экспериментальная модель DiffusionGemm от Google — она генерирует текст через диффузию

Google выпустила модель DiffusionGemma, использующую диффузионный метод вместо посимвольной генерации. Это позволяет обрабатывать 256 токенов параллельно и ускорять работу на GPU до 4 раз.