Новый бенчмарк ALE от ученых из Беркли показал, что GPT-5.5 справляется с комплексными профессиональными задачами лучше конкурентов, хотя общий уровень готовности ИИ остается низким.
Исследователи обнаружили, что локальные ИИ-модели так же уязвимы к непрямым инъекциям промптов, как и облачные, из-за архитектурных особенностей LLM.
Новая модель Claude Fable 5 демонстрирует выдающиеся результаты в кодинге, но шокирует стоимостью токенов и политикой хранения данных.
Anthropic представила пятое поколение моделей Claude. Fable 5 и Mythos 5 показывают рекордные результаты в программировании и науке, значительно опережая GPT 5.5.
Разработчик 0xcc.re представил Skynet, архитектуру, призванную излечить языковые модели от хронической амнезии. Проект переносит логику рассуждений ИИ на примитивы акторов Elixir, создавая долгоживущие сущности, способные сохранять состояние между вызовами.
Алекс Боукат из Sphere объясняет, почему Retrieval Augmented Generation остается ключевым инструментом для обеспечения точности и проверяемости ИИ-решений.