Google Cloud анонсировала общую доступность сервиса Cluster Director для автоматизации жизненного цикла ИИ- и HPC-кластеров на базе Slurm. Сервис охватывает проектирование, развертывание и мониторинг, стремясь избавить команды от рутины и повысить надежность инфраструктуры.
Эксперт Together.ai оспаривает тезис о «железном потолке» для AGI, утверждая, что низкая утилизация современных чипов и потенциал ко-дизайна железа и софта оставляют огромный простор для роста.
Nscale раскрывает детали работы своей платформы Fleet Operations, которая автоматизирует развертывание, мониторинг и обслуживание тысяч GPU-серверов для индустрии ИИ.
Lambda представляет стратегию мультиоблачной инфраструктуры для ИИ, позволяющую избежать блокировки вендорами, дефицита GPU и высоких затрат на передачу данных.
Nvidia приобрела SchedMD, компанию-разработчика системы управления заданиями Slurm, что усиливает ее контроль над программным стеком для суперкомпьютеров и ИИ-инфраструктуры.
Анализ рыночной ситуации, где конкуренция в разработке языковых моделей скрывает почти полную монополию одного поставщика аппаратного обеспечения — Nvidia.