Together AI и Hugging Face представили интеграцию для дообучения любых совместимых моделей из каталога Hub. Разработчики теперь могут тонко настраивать модели без сложной инфраструктуры.
Google Cloud анонсировала рецепт дезагрегированного инференса LLM с NVIDIA Dynamo на AI Hypercomputer, позволяющий значительно ускорить обработку запросов за счет разделения вычислительных фаз.
Together AI обновила платформу для тонкой настройки ИИ-моделей: поддержка 100B+ параметров, удвоение длины контекста и прямая интеграция с Hugging Face Hub.
Google Cloud анонсировала коммерческую доступность GKE Inference Gateway с новыми функциями оптимизации производительности и стоимости ML-инференса.
Стартап Together AI укрепляет инженерную команду, наняв экс-вице-президента Meta* по инфраструктуре для масштабирования облачных сервисов ИИ.
Google начал глобальное внедрение рекламы в AI-генерируемые ответы поиска через инструмент AI Max, что меняет его роль с поискового посредника на контент-провайдера с монетизацией.