Nvidia представила технологию KVTC с 20-кратным сжатием памяти для открытых LLM
Nvidia представила метод KVTC, позволяющий радикально снизить требования к видеопамяти для работы языковых моделей без изменения их весов.
NVIDIA — производитель GPU для AI. Их чипы питают революцию машинного обучения. Капитализация превысила $3 триллиона.
Nvidia представила метод KVTC, позволяющий радикально снизить требования к видеопамяти для работы языковых моделей без изменения их весов.
Индустрия ИИ переходит от обучения моделей к инференсу, что ставит под угрозу монополию Nvidia и требует новых архитектурных решений.
NVIDIA представила обновление TensorRT Edge-LLM, внедряющее поддержку архитектур MoE и гибридных моделей для запуска продвинутого ИИ на чипах Jetson и DRIVE Thor.
Эпоха низких цен на использование ИИ-моделей подходит к концу. Лаборатории готовятся к IPO, что заставит их отказаться от субсидирования тарифов и перейти к прибыльности.
NVIDIA инвестирует в стартап бывших топ-менеджеров OpenAI для создания гигантского дата-центра на базе архитектуры Vera Rubin.
OpenAI завершила один из крупнейших раундов финансирования в истории технологий. Инвестиции пойдут на развитие вычислительных мощностей и партнёрство с AWS, усиливая зависимость индустрии ИИ от капиталоёмкой инфраструктуры.