Nemotron

Nemotron — это семейство открытых AI-моделей, наборов данных и технологий от NVIDIA, предназначенное для построения эффективных, точных и специализированных агентных AI-систем. Платформа включает мультимодальные языковые модели с открытыми весами, данными обучения и рецептами оптимизации, позволяя разработчикам и предприятиям создавать и развёртывать высокопроизводительные AI-агенты на любой инфраструктуре — от локальных компьютеров до облачных кластеров. Nemotron ориентирована на разработчиков, исследователей, предприятия и компании, стремящиеся к созданию надёжных, прозрачных и масштабируемых AI-решений.

Платформа отличается прозрачностью — все модели, данные и методики обучения опубликованы открыто на Hugging Face и GitHub, что обеспечивает полный контроль над процессом разработки. Nemotron включает модели трёх весовых категорий (Nano, Super и Ultra) с поддержкой рассуждений на уровне выпускника, сложных математических вычислений, генерации кода и визуального анализа. Ключевые особенности — гибридная архитектура Transformer-Mamba для максимальной эффективности, конфигурируемые бюджеты мышления для баланса между скоростью и точностью, обучение с FP4 точностью для энергоэффективности и интеграция с NVIDIA NIM для оптимального развёртывания.

Особенности

  • Семейство мультимодальных моделей Nano, Super и Ultra с гибридной архитектурой Transformer-Mamba для 6-20x более высокой пропускной способности вывода по сравнению с традиционными моделями
  • Рассуждение уровня выпускника с поддержкой сложных математических вычислений, написания кода на 40+ языках программирования и решения задач на 50+ языках
  • Открытые наборы данных для предварительного и последующего обучения с публикацией методик и рецептов, позволяющих создавать пользовательские специализированные модели
  • Конфигурируемые режимы мышления для контролирования глубины рассуждений и балансирования между качеством ответов и операционными затратами
  • Интеграция с NVIDIA NIM для оптимизированного развёртывания с максимальной производительностью вывода и гибкими опциями развёртывания на любой инфраструктуре
  • Обучение с FP4 точностью на GPU Blackwell с Transformer Engine для энергоэффективного обучения без потери интеллектуальных возможностей
  • Мультимодальные возможности с поддержкой визуального анализа и обработки длинных контекстов до 128 000 токенов для сложных задач

Ссылки

Новости

NVIDIA Nemotron открывает исходники

NVIDIA Nemotron открывает исходники моделей и данных для ускорения развития ИИ

NVIDIA представила открытую экосистему Nemotron с моделями, данными и рецептами обучения для создания кастомных AI-систем любого масштаба.

Nvidia выпустила компактную модель Nemotron-Nano с переключаемой логикой

Nvidia выпустила компактную языковую модель Nemotron-Nano-9B-V2 с переключаемой функцией логических рассуждений и гибридной архитектурой для эффективного развертывания.