Sakana AI разработала эволюционный алгоритм M2N2 для объединения ИИ-моделей без дорогостоящего переобучения, создавая гибридные системы с новыми возможностями.
Андрей Карпати критикует обучение с подкреплением для LLM, предлагая интерактивные среды и системное промпт-обучение как альтернативные парадигмы для следующего прорыва в ИИ.
Представлен первый набор моделей для обнаружения галлюцинаций в турецком языке для RAG-систем, включающий три архитектуры и переведенный датасет.
AWS анонсировала автоматическое масштабирование для SageMaker HyperPod на базе Karpenter, что позволяет динамически управлять GPU-ресурсами для ML-процессов без операционных затрат.
Model2Vec позволяет создавать сверхбыстрые статические эмбеддинги из Sentence Transformers с ускорением в 500 раз и уменьшением размера в 15 раз без потери качества.
NVIDIA разработала метод тонкой настройки GPT-OSS с обучением с учетом квантизации, позволяющий сохранить преимущества 4-битного формата при восстановлении точности для специализированных задач.