KV-кэш

Новости

Google представила алгоритм TurboQuant

Google представила алгоритм TurboQuant, сокращающий объем KV-кэша без потери точности

Исследователи Google разработали TurboQuant — новый алгоритм квантования, который радикально сокращает объем KV-кэша и ускоряет работу языковых моделей.