NVIDIA адаптирует тяжелые нейросети для работы на периферийных устройствах
NVIDIA представила обновление TensorRT Edge-LLM, внедряющее поддержку архитектур MoE и гибридных моделей для запуска продвинутого ИИ на чипах Jetson и DRIVE Thor.
Новости о технике и железе для искусственного интеллекта. GPU, TPU, специализированные AI-чипы от NVIDIA, AMD, Intel. Облачные платформы для ML, обзоры программного обеспечения, фреймворков и инструментов разработки. Аппаратное обеспечение для обучения и инференса нейросетей. Сравнения производительности и рекомендации по выбору.
NVIDIA представила обновление TensorRT Edge-LLM, внедряющее поддержку архитектур MoE и гибридных моделей для запуска продвинутого ИИ на чипах Jetson и DRIVE Thor.
Intel расширила возможности проекта LLM-Scaler, добавив поддержку моделей семейства Qwen3.5 и ASR-модели для распознавания речи. Обновление позволяет запускать современные нейросети на потребительских видеокартах Arc с использованием vLLM и Docker.
NVIDIA инвестирует в стартап бывших топ-менеджеров OpenAI для создания гигантского дата-центра на базе архитектуры Vera Rubin.
Старые GPU Nvidia остаются востребованными благодаря глубокой привязке индустрии к CUDA. Программная экосистема снижает стимулы перехода на альтернативы, однако рост инференса и собственные чипы гиперскейлеров могут стать долгосрочным вызовом для компании.
Открытая архитектура RISC-V бросает вызов проприетарным стандартам Intel и Arm в гонке AI-чипов. Геополитическая нейтральность и поддержка гигантов вроде Nvidia делают её главным претендентом на смену парадигмы.
Google Cloud признан лидером в отчете Forrester Wave по инфраструктурным решениям для искусственного интеллекта за 2025 год, получив высшие оценки в стратегии и рыночном присутствии.