Google Research представила TurboQuant — метод экстремального сжатия KV-кэша, который позволяет ИИ-моделям работать с огромными контекстами при меньших затратах памяти.
Исследование Google Research показало, что современные бенчмарки ИИ не учитывают разногласия между людьми, используя слишком мало оценщиков для тестов.
Исследователи Google разработали TurboQuant — новый алгоритм квантования, который радикально сокращает объем KV-кэша и ускоряет работу языковых моделей.
Google Research представила метод Bayesian teaching, позволяющий языковым моделям эффективнее обновлять знания в ходе диалога и работать в условиях неопределенности.