Google Research

Новости

TurboQuant и сжатие KV-кэша

TurboQuant: как Google Research пытается снести «стену памяти» в больших языковых моделях

Google Research представила TurboQuant — метод экстремального сжатия KV-кэша, который позволяет ИИ-моделям работать с огромными контекстами при меньших затратах памяти.

бенчмарки игнорируют человека

Исследование Google показало, что ИИ-бенчмарки игнорируют человеческий фактор

Исследование Google Research показало, что современные бенчмарки ИИ не учитывают разногласия между людьми, используя слишком мало оценщиков для тестов.

Google представила алгоритм TurboQuant

Google представила алгоритм TurboQuant, сокращающий объем KV-кэша без потери точности

Исследователи Google разработали TurboQuant — новый алгоритм квантования, который радикально сокращает объем KV-кэша и ускоряет работу языковых моделей.

байесовское наставничество LLM

В Google придумали, обновлять убеждения LLM при получении новой информации

Google Research представила метод Bayesian teaching, позволяющий языковым моделям эффективнее обновлять знания в ходе диалога и работать в условиях неопределенности.