Новости об искусственном интеллекте и высоких технологиях

Модели Latent Context обещают избавить нейросети от тупика, сжимая контекст в 16 раз

Исследователи представили LCLM — модели, которые сжимают входные данные в 16 раз до обработки декодером, обеспечивая кратный прирост скорости работы нейросетей.

Anthropic обвинили в том, что методы компании напоминают старые стратегии Microsoft

Компания Anthropic столкнулась с критикой из-за ограничения мощности моделей для конкурентов и запуска сервисов, вытесняющих собственных партнеров.

GitHub внедряет проверку безопасности на базе LLM прямо в консоль Copilot CLI

GitHub внедрил экспериментальную функцию /security-review в Copilot CLI, позволяющую находить уязвимости в коде с помощью ИИ прямо в терминале.

Разработчики из Sapient смогли обучить базовую ИИ-модель всего за $1500

Исследователи из Sapient представили архитектуру HRM-Text, позволившую обучить базовую модель с 1 млрд параметров всего за 1500 долларов, бросив вызов доминированию тяжелых трансформеров.

Модель Mythos доказала, что ИИ способен взламывать патчи безопасности за считанные часы

Команда Anthropic доказала, что современные ИИ-модели способны проводить реверс-инжиниринг патчей безопасности и создавать рабочие эксплойты в течение одного дня.

Вышла экспериментальная модель DiffusionGemm от Google — она генерирует текст через диффузию

Google выпустила модель DiffusionGemma, использующую диффузионный метод вместо посимвольной генерации. Это позволяет обрабатывать 256 токенов параллельно и ускорять работу на GPU до 4 раз.