Fable 5 vs GPT-5.5

Claude Fable 5 оказалась слабее GPT-5.5 в новом стресс-тесте для ИИ-агентов Agents’ Last Exam

Новый бенчмарк ALE от ученых из Беркли показал, что GPT-5.5 справляется с комплексными профессиональными задачами лучше конкурентов, хотя общий уровень готовности ИИ остается низким.

Непрямая инъекция промптов

LLM могут быть поражены через непрямые инъекции промптов даже при локальном запуске

Исследователи обнаружили, что локальные ИИ-модели так же уязвимы к непрямым инъекциям промптов, как и облачные, из-за архитектурных особенностей LLM.

Цена Claude Fable 5

Выход Claude Fable 5 может означать конец эпохи дешевого ИИ

Новая модель Claude Fable 5 демонстрирует выдающиеся результаты в кодинге, но шокирует стоимостью токенов и политикой хранения данных.

Fable 5 и Mythos 5

Anthropic представила пятое поколение Claude — модели Fable 5 и Mythos 5, но в урезанном виде

Anthropic представила пятое поколение моделей Claude. Fable 5 и Mythos 5 показывают рекордные результаты в программировании и науке, значительно опережая GPT 5.5.

Skynet Elixir GenServer

Автор новой архитектуры Skynet предлагает вместо векторного поиска встроить память в процесс

Разработчик 0xcc.re представил Skynet, архитектуру, призванную излечить языковые модели от хронической амнезии. Проект переносит логику рассуждений ИИ на примитивы акторов Elixir, создавая долгоживущие сущности, способные сохранять состояние между вызовами.

RAG важнее контекста

Технология RAG может быть полезнее огромного контекстного окна в задачах на точность

Алекс Боукат из Sphere объясняет, почему Retrieval Augmented Generation остается ключевым инструментом для обеспечения точности и проверяемости ИИ-решений.