Топ-менеджеры Microsoft, Apple и Nvidia раскрыли свои стратегии использования GPT-5 и других ИИ-инструментов для управления бизнесом, подготовки к встречам и ускорения обучения.
Google Cloud анонсировала рецепт дезагрегированного инференса LLM с NVIDIA Dynamo на AI Hypercomputer, позволяющий значительно ускорить обработку запросов за счет разделения вычислительных фаз.
Thinking Machines Lab раскрыла первый технический проект по созданию детерминированных ИИ-моделей с воспроизводимыми ответами через контроль ядер GPU.
Тесты MLPerf Inference v5.1 показывают до 15.4% прироста производительности LLM на системе NVIDIA HGX B200 от Lambda, что подтверждает готовность инфраструктуры для корпоративного внедрения.
Nvidia анонсировала Rubin CPX — первый специализированный GPU для обработки миллионов токенов контекста в ИИ-моделях с производительностью 30 петафлопс.
NVIDIA на IAA Mobility представила облачно-автомобильную платформу ИИ для автономного вождения с акцентом на безопасность и партнерства с ведущими автопроизводителями.