Оглавление

Компания NVIDIA, давно закрепившая за собой статус главного архитектора «железа» для искусственного интеллекта, теперь планомерно забирает лидерство и в программном стеке. Как сообщает издание Wccftech, открытая модель Nemotron 3 Super заняла первую строчку в авторитетном бенчмарке EnterpriseOps-Gym, продемонстрировав превосходство над сильными конкурентами в лице DeepSeek и GPT-OSS.

Представленная в марте 2026 года, Nemotron 3 Super представляет собой модель со 120 миллиардами параметров, из которых 12 миллиардов являются активными. В ее основе лежит гибридная архитектура Mixture of Experts (MoE), которая позволяет достичь пятикратного прироста пропускной способности по сравнению с предыдущими итерациями. Особого внимания заслуживает контекстное окно в 1 миллион токенов, обеспечивающее агентам впечатляющую глубину памяти.

Технологический фундамент и архитектурные решения

Успех модели в тестах EnterpriseOps-Gym, где оценивается выполнение 1 150 задач в интерактивных средах с использованием 512 инструментов, обусловлен несколькими инженерными находками. NVIDIA внедрила технологию Latent MoE, которая сжимает токены перед их обработкой экспертными слоями, что позволяет задействовать в четыре раза больше специалистов при тех же вычислительных затратах.

Еще одной важной деталью стало использование Multi-token prediction (MTP). Этот механизм предсказывает несколько будущих токенов за один проход, что критически важно для генерации длинных последовательностей. Кроме того, архитектура Hybrid Mamba-Transformer объединяет слои Mamba для эффективности обработки последовательностей с классическими трансформерами, обеспечивающими точность рассуждений.

  • NVFP4 pretraining: оптимизация под архитектуру Blackwell ускоряет инференс на чипах B200 в четыре раза по сравнению с FP8 на H100.
  • RL-пост-обучение: модель прошла через 1,2 миллиона итераций в 21 конфигурации среды с использованием NeMo Gym.
  • Высокая адаптивность: лидерство в рабочих процессах типа TEAMS, Email и гибридных сценариях.

Высокая зависимость от проприетарного формата NVFP4 и архитектуры Blackwell намекает, что «открытость» модели имеет четкий маркетинговый привкус, привязывая софт к конкретному дорогому кремнию. NVIDIA мастерски строит золотую клетку, где прутья сделаны из лучшего в индустрии кода.

Рыночные перспективы и экосистема

В текущем рейтинге Nemotron 3 Super набрала 27,3 балла, потеснив Kimi-K2.5 и DeepSeek v3.2 на второе и третье места соответственно. Модель GPT-OSS-120B оказалась на пятой строчке. Для индустрии это важный сигнал: графический гигант больше не довольствуется ролью поставщика «лопат» для золотой лихорадки ИИ, он намерен сам определять правила добычи этого золота.

Линейка Nemotron 3 включает версии Nano, Super и Ultra, закрывая потребности от мобильных устройств до огромных кластеров. Такая стратегия позволяет NVIDIA предлагать законченный вертикально интегрированный стек. Наблюдая за тем, как быстро компания обновляет свои программные продукты, невольно задаешься вопросом: останется ли в этом будущем место для независимых разработчиков моделей, не обладающих собственными фабриками по производству чипов.