Железо

Новости о технике и железе для искусственного интеллекта. GPU, TPU, специализированные AI-чипы от NVIDIA, AMD, Intel. Облачные платформы для ML, обзоры программного обеспечения, фреймворков и инструментов разработки. Аппаратное обеспечение для обучения и инференса нейросетей. Сравнения производительности и рекомендации по выбору.

Intel

Intel представляет мультимодальный агентный конвейер для локального ИИ на ПК

Intel представила мультимодальный агентный RAG-конвейер для локального запуска на ПК с процессорами Core Ultra. Технология объединяет обработку текста, изображений и видео без облачной зависимости.

Figure AI привлекает деньги на выпуск человекоподобных роботов

Figure AI привлекает миллиард долларов на производство человекоподобных роботов

Figure AI привлекла более $1 млрд на производство человекоподобных роботов и развитие ИИ-платформы Helix. Компания планирует выпустить 100 тысяч роботов за 4 года.

Nvidia опережает конкурентов в ИИ-инференсе

Nvidia Rubin CPX меняет правила игры в AI-инференсе, оставляя конкурентов позади

Nvidia представила специализированный ускоритель Rubin CPX для этапа префилла в AI-инференсе, что может закрепить ее лидерство и заставить конкурентов пересматривать стратегии.

Google Cloud представила рецепт ускоренного инференса LLM с NVIDIA Dynamo

Google Cloud анонсировала рецепт дезагрегированного инференса LLM с NVIDIA Dynamo на AI Hypercomputer, позволяющий значительно ускорить обработку запросов за счет разделения вычислительных фаз.

Google логотип

Google выводит на рынок готовые решения для масштабирования ML-инференса

Google Cloud анонсировала коммерческую доступность GKE Inference Gateway с новыми функциями оптимизации производительности и стоимости ML-инференса.

Huawei не хватает модулей памяти

Производство AI-чипов Huawei тормозится дефицитом памяти HBM

Huawei сталкивается с критической нехваткой памяти HBM для производства AI-чипов, что может серьезно ограничить китайские амбиции в искусственном интеллекте.