Оглавление

The Decoder пишет, что Nvidia представила принципиально новый класс графических процессоров. Rubin CPX станет первым в истории CUDA-совместимым GPU, созданным исключительно для задач анализа гигантских контекстных окон в искусственном интеллекте.

Архитектурный прорыв для раздельного инференса

Традиционно ИИ-модели работают в двух фазах: анализ контекста (вычислительно интенсивная) и генерация ответа (требующая высокой пропускной способности памяти). Rubin CPX фокусируется на первой фазе, где необходимо обрабатывать миллионы токенов — целые кодобазы, длинные видео или объемные документы.

Технические характеристики нового чипа впечатляют:

  • Монолитный дизайн кристалла
  • Вычислительная мощность: 30 петафлопс NVFP4
  • Объем памяти: 128 ГБ GDDR7
  • Ускорение attention-слоев: в 3 раза выше, чем у Blackwell

Практическое подтверждение концепции

Nvidia не просто анонсирует концепт — компания уже демонстрирует работоспособность подхода. В тестах MLPerf Inference v5.1 архитектура Blackwell Ultra показала на 45% более высокую производительность на GPU по сравнению с обычным Blackwell. Для модели Llama 3.1 405B использование «разделенного инференса» через Nvidia Dynamo Framework дало почти 1.5-кратный прирост производительности на один GPU.

Это не просто эволюция железа — это признание того, что универсальные архитектуры достигли предела эффективности для специализированных рабочих нагрузок. Вместо того чтобы наращивать мегагерцы всем подряд, Nvidia создает специализированный инструмент под конкретную задачу. Интересно, сколько будет стоить этот монстр и как быстро конкуренты предложат альтернативы.

Рыночные перспективы и партнеры

Ожидается, что Rubin CPX выйдет в конце 2026 года в формате платы расширения или отдельного серверного решения. Среди первых партнеров, тестирующих технологию — Cursor (редактор кода), Runway (видеогенерация) и Magic (AI-агенты).

Этот шаг подтверждает тренд на специализацию аппаратного обеспечения под конкретные ИИ-задачи. В то время как другие игроки пытаются создавать универсальные чипы, Nvidia делает ставку на глубокую оптимизацию под доминирующие рабочие нагрузки.