Оптимизация Triton ускоряет матричные вычисления для моделей Mixture-of-Experts
Новое ядро Triton для Grouped GEMM ускоряет обучение MoE-моделей в 2.62 раза на NVIDIA H100 за счет persistent kernel, cache-aware вычислений и TMA.
12 сентября 2025
Новое ядро Triton для Grouped GEMM ускоряет обучение MoE-моделей в 2.62 раза на NVIDIA H100 за счет persistent kernel, cache-aware вычислений и TMA.
Serve Robotics приобрела стартап Vayu Robotics для усиления ИИ-платформы автономных роботов. Сделка ускорит внедрение адаптивных систем доставки.
Стартап Paradigm запустил электронные таблицы с ИИ-агентом в каждой ячейке, поддерживающие модели Anthropic, OpenAI и Gemini. Проект привлёк $7 млн инвестиций.
Мутации в микробелках меняют представления о генетике болезней. Инструмент ShortStop на базе ML ускоряет их изучение, открывая новые возможности для диагностики и терапии.
Пока запрет TikTok в США приостановлен, ByteDance запускает серию AI-приложений, включая Trae и Dreamina. Компания использует политическую передышку для экспансии, несмотря на геополитические риски.
Международное право сохраняет силу для военных ИИ-систем, но алгоритмическая непредсказуемость создаёт практические сложности. ООН разрабатывает регулирование автономного оружия к 2026 году.