Nemotron

Nemotron — это семейство открытых AI-моделей, наборов данных и технологий от NVIDIA, предназначенное для построения эффективных, точных и специализированных агентных AI-систем. Платформа включает мультимодальные языковые модели с открытыми весами, данными обучения и рецептами оптимизации, позволяя разработчикам и предприятиям создавать и развёртывать высокопроизводительные AI-агенты на любой инфраструктуре — от локальных компьютеров до облачных кластеров. Nemotron ориентирована на разработчиков, исследователей, предприятия и компании, стремящиеся к созданию надёжных, прозрачных и масштабируемых AI-решений.

Платформа отличается прозрачностью — все модели, данные и методики обучения опубликованы открыто на Hugging Face и GitHub, что обеспечивает полный контроль над процессом разработки. Nemotron включает модели трёх весовых категорий (Nano, Super и Ultra) с поддержкой рассуждений на уровне выпускника, сложных математических вычислений, генерации кода и визуального анализа. Ключевые особенности — гибридная архитектура Transformer-Mamba для максимальной эффективности, конфигурируемые бюджеты мышления для баланса между скоростью и точностью, обучение с FP4 точностью для энергоэффективности и интеграция с NVIDIA NIM для оптимального развёртывания.

Особенности

Семейство мультимодальных моделей Nano, Super и Ultra с гибридной архитектурой Transformer-Mamba для 6-20x более высокой пропускной способности вывода по сравнению с традиционными моделями
Рассуждение уровня выпускника с поддержкой сложных математических вычислений, написания кода на 40+ языках программирования и решения задач на 50+ языках
Открытые наборы данных для предварительного и последующего обучения с публикацией методик и рецептов, позволяющих создавать пользовательские специализированные модели
Конфигурируемые режимы мышления для контролирования глубины рассуждений и балансирования между качеством ответов и операционными затратами
Интеграция с NVIDIA NIM для оптимизированного развёртывания с максимальной производительностью вывода и гибкими опциями развёртывания на любой инфраструктуре
Обучение с FP4 точностью на GPU Blackwell с Transformer Engine для энергоэффективного обучения без потери интеллектуальных возможностей
Мультимодальные возможности с поддержкой визуального анализа и обработки длинных контекстов до 128 000 токенов для сложных задач

Ссылки