PyTorch

PyTorch — открытый фреймворк глубокого обучения от Meta AI. Популярная платформа для исследований и production в области нейронных сетей. Новости о новых версиях, оптимизациях, интеграции с hardware-ускорителями и применении в передовых AI-проектах.

Новости

Обучение MoE-моделей на 1024 GPU

AMD и PyTorch организовали эффективное обучение MoE-моделей на 1024 AMD GPU с TorchTitan

AMD и Meta* достигли 96% эффективности масштабирования при обучении MoE-моделей на 1024 GPU с помощью TorchTitan и Primus-Turbo.

PyTorch представляет OpenReg

PyTorch представляет OpenReg — симулятор акселераторов для тестирования аппаратного обеспечения

PyTorch выпустила OpenReg — симулятор акселераторов для тестирования пользовательского аппаратного обеспечения с использованием механизма PrivateUse1 DispatchKey.

Алгоритм оптимизации Adam

Как на практике используется алгоритм оптимизации Adam для обучения нейросетей

Глубокий анализ оптимизатора Adam — фундаментального алгоритма для обучения нейронных сетей, его технических особенностей и практического применения в современных ML-фреймворках.

PyTorch внедряет разреженный вывод

PyTorch внедряет разреженный вывод для ускорения работы больших языковых моделей

PyTorch представляет фреймворк разреженного вывода для LLM, обещающий ускорение в 2-6 раз. Технология использует кэширование весов и новые методы порогового отсечения для современных моделей.

Helion — высокоуровневый DSL

Helion — высокоуровневый DSL для создания производительных и портируемых ядер ML

PyTorch представил Helion — высокоуровневый DSL для создания оптимизированных ядер ML, который компилируется в код Triton и автоматически настраивает производительность для разных аппаратных архитектур.

PyTorch выпустила torchcomms

PyTorch выпустила torchcomms — API для распределенных вычислений на сотни тысяч GPU

PyTorch представил torchcomms — новый API для распределенных вычислений, способный масштабироваться на сотни тысяч GPU. Включает бэкенд NCCLX, уже используемый Meta для обучения Llama3 и Llama4.