Исследователи из Sapient представили архитектуру HRM-Text, позволившую обучить базовую модель с 1 млрд параметров всего за 1500 долларов, бросив вызов доминированию тяжелых трансформеров.
Команда Anthropic доказала, что современные ИИ-модели способны проводить реверс-инжиниринг патчей безопасности и создавать рабочие эксплойты в течение одного дня.
Google выпустила модель DiffusionGemma, использующую диффузионный метод вместо посимвольной генерации. Это позволяет обрабатывать 256 токенов параллельно и ускорять работу на GPU до 4 раз.
Новый бенчмарк ALE от ученых из Беркли показал, что GPT-5.5 справляется с комплексными профессиональными задачами лучше конкурентов, хотя общий уровень готовности ИИ остается низким.
Исследователи обнаружили, что локальные ИИ-модели так же уязвимы к непрямым инъекциям промптов, как и облачные, из-за архитектурных особенностей LLM.
Новая модель Claude Fable 5 демонстрирует выдающиеся результаты в кодинге, но шокирует стоимостью токенов и политикой хранения данных.