Оглавление

На конференции SC25 NVIDIA продемонстрировала комплексный подход к созданию инфраструктуры для ИИ-суперкомпьютеров, представив новые разработки в области ускорителей, сетевых технологий и квантовых вычислений. По сообщению NVIDIA, эти инновации закладывают основу для следующего этапа развития высокопроизводительных вычислений.

DGX Spark: суперкомпьютер в настольном формате

Особого внимания заслуживает DGX Spark — самый компактный в мире ИИ-суперкомпьютер, который начал поставляться в прошлом месяце. Эта система на архитектуре Grace Blackwell объединяет в настольном форм-факторе производительность в один петафлопс для задач ИИ и 128 ГБ единой памяти.

Ключевые характеристики DGX Spark:

  • Возможность запуска инференса для моделей до 200 миллиардов параметров
  • Локальная тонкая настройка моделей любого масштаба
  • Пропускная способность NVLink-C2C в 5 раз выше, чем у PCIe Gen5
  • Полный стек программного обеспечения NVIDIA AI

Apollo: открытые модели для физического ИИ

NVIDIA Apollo представляет собой семейство открытых моделей для физического ИИ, которые уже находят применение у таких промышленных гигантов, как Applied Materials, Cadence, Siemens и Synopsys. Эти модели используются для симуляции и ускорения процессов проектирования в различных областях:

  • Автоматизация электронных устройств и полупроводников
  • Вычислительная гидродинамика
  • Структурная механика и электромагнетизм
  • Прогнозирование погоды

Модели Apollo используют передовые архитектуры машинного обучения, включая нейронные операторы, трансформеры и диффузионные методы, объединенные с предметными знаниями конкретных областей.

Warp: ускорение физических симуляций

NVIDIA Warp — это открытый фреймворк на Python, обеспечивающий ускорение вычислений для физики и ИИ до 245 раз по сравнению с CPU. Фреймворк сочетает доступность Python с производительностью, сравнимой с нативным кодом на CUDA.

Что действительно впечатляет в Warp — это демократизация высокопроизводительных вычислений. Теперь разработчики могут создавать сложные симуляции, не покидая привычную среду Python, и получать при этом производительность уровня CUDA. Это может серьезно изменить ландшафт научных вычислений, сделав мощные симуляции доступными для более широкого круга исследователей.

Warp поддерживает создание GPU-ускоренных 3D-симуляций, интегрируемых с конвейерами машинного обучения в PyTorch, JAX, NVIDIA PhysicsNeMo и NVIDIA Omniverse.

BlueField-4: операционная система для ИИ-фабрик

Представленные ранее на GTC в Вашингтоне, DPU BlueField-4 становятся основой операционной системы для ИИ-фабрик. Эти процессоры разгружают, ускоряют и изолируют критические функции центра обработки данных — сетевые, хранилищные и безопасностные — позволяя CPU и GPU сосредоточиться исключительно на вычислительных задачах.

BlueField-4 объединяет 64-ядерный процессор NVIDIA Grace и сетевой контроллер ConnectX-9, обеспечивая беспрецедентную производительность, эффективность и безопасность по принципу нулевого доверия в масштабе.

Квантовые сети следующего поколения

TACC, Lambda и CoreWeive анонсировали планы по интеграции коммутаторов NVIDIA Quantum-X Photonics CPO в системы следующего поколения уже в следующем году. Эти решения позволяют ИИ-фабрикам и суперкомпьютерным центрам значительно сократить энергопотребление и операционные расходы.

Ключевые преимущества Quantum-X Photonics:

  • В 3,5 раза лучшая энергоэффективность
  • В 10 раз выше отказоустойчивость
  • Возможность работы приложений в 5 раз дольше без прерываний
  • Устранение традиционных съемных трансиверов — частой причины сбоев

Ведущие поставщики систем хранения — DDN, VAST Data и WEKA — уже адаптируют BlueField-4 для переопределения производительности и эффективности для рабочих нагрузок ИИ и научных вычислений.

Эти разработки демонстрируют, как NVIDIA продолжает расширять границы возможного в области высокопроизводительных вычислений, создавая комплексную экосистему для следующего поколения ИИ-суперкомпьютеров.