Оптимизация Triton ускоряет матричные вычисления для моделей Mixture-of-Experts
Новое ядро Triton для Grouped GEMM ускоряет обучение MoE-моделей в 2.62 раза на NVIDIA H100 за счет persistent kernel, cache-aware вычислений и TMA.
PyTorch — открытый фреймворк глубокого обучения от Meta AI. Популярная платформа для исследований и production в области нейронных сетей. Новости о новых версиях, оптимизациях, интеграции с hardware-ускорителями и применении в передовых AI-проектах.
Новое ядро Triton для Grouped GEMM ускоряет обучение MoE-моделей в 2.62 раза на NVIDIA H100 за счет persistent kernel, cache-aware вычислений и TMA.
PyTorch анонсировал проведение Open Source AI Week в Сан-Франциско в октябре 2025 года. Мероприятие объединит разработчиков для обсуждения современных ML-фреймворков и проблем внедрения открытых решений.
Обзор ключевых анонсов PyTorch Day China 2025: универсальные инструменты для железа, рост open source проектов и локализация экосистемы.
Stability AI и NVIDIA представили микросервис SD3.5 NIM с ускорением генерации изображений в 1.8 раза и контейнерным развёртыванием для предприятий.
Opacus добавил поддержку mixed precision для DP-SGD, ускоряя обучение в 2-6 раз и вдвое сокращая потребление памяти. Технология особенно эффективна при использовании LoRA.
Hugging Face представляет Ark — фреймворк, призванный устранить разрыв между ML и робототехникой. Python-интерфейс, бесшовный sim-to-real и Gym-совместимость.