Железо

Новости о технике и железе для искусственного интеллекта. GPU, TPU, специализированные AI-чипы от NVIDIA, AMD, Intel. Облачные платформы для ML, обзоры программного обеспечения, фреймворков и инструментов разработки. Аппаратное обеспечение для обучения и инференса нейросетей. Сравнения производительности и рекомендации по выбору.

Nvidia опережает конкурентов в ИИ-инференсе

Nvidia Rubin CPX меняет правила игры в AI-инференсе, оставляя конкурентов позади

Nvidia представила специализированный ускоритель Rubin CPX для этапа префилла в AI-инференсе, что может закрепить ее лидерство и заставить конкурентов пересматривать стратегии.

Google Cloud представила рецепт ускоренного инференса LLM с NVIDIA Dynamo

Google Cloud анонсировала рецепт дезагрегированного инференса LLM с NVIDIA Dynamo на AI Hypercomputer, позволяющий значительно ускорить обработку запросов за счет разделения вычислительных фаз.

Google логотип

Google выводит на рынок готовые решения для масштабирования ML-инференса

Google Cloud анонсировала коммерческую доступность GKE Inference Gateway с новыми функциями оптимизации производительности и стоимости ML-инференса.

Huawei не хватает модулей памяти

Производство AI-чипов Huawei тормозится дефицитом памяти HBM

Huawei сталкивается с критической нехваткой памяти HBM для производства AI-чипов, что может серьезно ограничить китайские амбиции в искусственном интеллекте.

Компания Nvidia

NVIDIA HGX B200 демонстрирует до 15.4% прироста производительности в тестах MLPerf Inference v5.1

Тесты MLPerf Inference v5.1 показывают до 15.4% прироста производительности LLM на системе NVIDIA HGX B200 от Lambda, что подтверждает готовность инфраструктуры для корпоративного внедрения.

Nvidia анонсировала Rubin CPX

Nvidia анонсировала Rubin CPX — первый GPU для обработки миллионов токенов контекста

Nvidia анонсировала Rubin CPX — первый специализированный GPU для обработки миллионов токенов контекста в ИИ-моделях с производительностью 30 петафлопс.