Архивы Google Research

TurboQuant: как Google Research пытается снести «стену памяти» в больших языковых моделях

Google Research представила TurboQuant — метод экстремального сжатия KV-кэша, который позволяет ИИ-моделям работать с огромными контекстами при меньших затратах памяти.

Исследование Google показало, что ИИ-бенчмарки игнорируют человеческий фактор

Исследование Google Research показало, что современные бенчмарки ИИ не учитывают разногласия между людьми, используя слишком мало оценщиков для тестов.

Google представила алгоритм TurboQuant, сокращающий объем KV-кэша без потери точности

Исследователи Google разработали TurboQuant — новый алгоритм квантования, который радикально сокращает объем KV-кэша и ускоряет работу языковых моделей.

В Google придумали, обновлять убеждения LLM при получении новой информации

Google Research представила метод Bayesian teaching, позволяющий языковым моделям эффективнее обновлять знания в ходе диалога и работать в условиях неопределенности.

Новости

Google Research

Новости

TurboQuant: как Google Research пытается снести «стену памяти» в больших языковых моделях

Исследование Google показало, что ИИ-бенчмарки игнорируют человеческий фактор

Google представила алгоритм TurboQuant, сокращающий объем KV-кэша без потери точности

В Google придумали, обновлять убеждения LLM при получении новой информации