Улучшение низкобитных операторов в PyTorch и ExecuTorch: динамический выбор ядер, KleidiAI и квантованные связанные эмбеддинги
TorchAO представляет динамический выбор ядер, интеграцию с KleidiAI и квантованные связанные эмбеддинги для ускорения низкобитного вывода на Arm CPU. Результат: 2-кратный прирост скорости на M1.