Google представила OpenRL — API для тонкой настройки моделей внутри Kubernetes
Google представила OpenRL, open-source решение для дообучения языковых моделей на Kubernetes, которое разделяет управление инфраструктурой и исследовательскую работу.
Google представила OpenRL, open-source решение для дообучения языковых моделей на Kubernetes, которое разделяет управление инфраструктурой и исследовательскую работу.
Переход от монолитного инференса к разделению стадий prefill и decode позволяет оптимизировать использование GPU, но требует сложной оркестрации в Kubernetes.
ScaleOps представила продукт для оптимизации GPU-инфраструктуры в корпоративных AI-развертываниях. Решение сокращает затраты на GPU на 50-70% и повышает эффективность использования ресурсов.
Databricks разработала клиентскую систему балансировки нагрузки для Kubernetes, решающую проблемы стандартных механизмов при работе с высоконагруженными gRPC-сервисами.
Solo.io представляет Kagent Enterprise — платформу для управления AI-агентами в Kubernetes, решающую проблемы масштабирования и безопасности в продакшен-среде.