Оглавление
На конференции SC25 NVIDIA продемонстрировала комплексный подход к созданию инфраструктуры для ИИ-суперкомпьютеров, представив новые разработки в области ускорителей, сетевых технологий и квантовых вычислений. По сообщению NVIDIA, эти инновации закладывают основу для следующего этапа развития высокопроизводительных вычислений.
DGX Spark: суперкомпьютер в настольном формате
Особого внимания заслуживает DGX Spark — самый компактный в мире ИИ-суперкомпьютер, который начал поставляться в прошлом месяце. Эта система на архитектуре Grace Blackwell объединяет в настольном форм-факторе производительность в один петафлопс для задач ИИ и 128 ГБ единой памяти.
Ключевые характеристики DGX Spark:
- Возможность запуска инференса для моделей до 200 миллиардов параметров
- Локальная тонкая настройка моделей любого масштаба
- Пропускная способность NVLink-C2C в 5 раз выше, чем у PCIe Gen5
- Полный стек программного обеспечения NVIDIA AI
Apollo: открытые модели для физического ИИ
NVIDIA Apollo представляет собой семейство открытых моделей для физического ИИ, которые уже находят применение у таких промышленных гигантов, как Applied Materials, Cadence, Siemens и Synopsys. Эти модели используются для симуляции и ускорения процессов проектирования в различных областях:
- Автоматизация электронных устройств и полупроводников
- Вычислительная гидродинамика
- Структурная механика и электромагнетизм
- Прогнозирование погоды
Модели Apollo используют передовые архитектуры машинного обучения, включая нейронные операторы, трансформеры и диффузионные методы, объединенные с предметными знаниями конкретных областей.
Warp: ускорение физических симуляций
NVIDIA Warp — это открытый фреймворк на Python, обеспечивающий ускорение вычислений для физики и ИИ до 245 раз по сравнению с CPU. Фреймворк сочетает доступность Python с производительностью, сравнимой с нативным кодом на CUDA.
Что действительно впечатляет в Warp — это демократизация высокопроизводительных вычислений. Теперь разработчики могут создавать сложные симуляции, не покидая привычную среду Python, и получать при этом производительность уровня CUDA. Это может серьезно изменить ландшафт научных вычислений, сделав мощные симуляции доступными для более широкого круга исследователей.
Warp поддерживает создание GPU-ускоренных 3D-симуляций, интегрируемых с конвейерами машинного обучения в PyTorch, JAX, NVIDIA PhysicsNeMo и NVIDIA Omniverse.
BlueField-4: операционная система для ИИ-фабрик
Представленные ранее на GTC в Вашингтоне, DPU BlueField-4 становятся основой операционной системы для ИИ-фабрик. Эти процессоры разгружают, ускоряют и изолируют критические функции центра обработки данных — сетевые, хранилищные и безопасностные — позволяя CPU и GPU сосредоточиться исключительно на вычислительных задачах.
BlueField-4 объединяет 64-ядерный процессор NVIDIA Grace и сетевой контроллер ConnectX-9, обеспечивая беспрецедентную производительность, эффективность и безопасность по принципу нулевого доверия в масштабе.
Квантовые сети следующего поколения
TACC, Lambda и CoreWeive анонсировали планы по интеграции коммутаторов NVIDIA Quantum-X Photonics CPO в системы следующего поколения уже в следующем году. Эти решения позволяют ИИ-фабрикам и суперкомпьютерным центрам значительно сократить энергопотребление и операционные расходы.
Ключевые преимущества Quantum-X Photonics:
- В 3,5 раза лучшая энергоэффективность
- В 10 раз выше отказоустойчивость
- Возможность работы приложений в 5 раз дольше без прерываний
- Устранение традиционных съемных трансиверов — частой причины сбоев
Ведущие поставщики систем хранения — DDN, VAST Data и WEKA — уже адаптируют BlueField-4 для переопределения производительности и эффективности для рабочих нагрузок ИИ и научных вычислений.
Эти разработки демонстрируют, как NVIDIA продолжает расширять границы возможного в области высокопроизводительных вычислений, создавая комплексную экосистему для следующего поколения ИИ-суперкомпьютеров.
Оставить комментарий