NVIDIA Nemotron открывает исходники моделей и данных для ускорения развития ИИ
NVIDIA представила открытую экосистему Nemotron с моделями, данными и рецептами обучения для создания кастомных AI-систем любого масштаба.
Nemotron — это семейство открытых AI-моделей, наборов данных и технологий от NVIDIA, предназначенное для построения эффективных, точных и специализированных агентных AI-систем. Платформа включает мультимодальные языковые модели с открытыми весами, данными обучения и рецептами оптимизации, позволяя разработчикам и предприятиям создавать и развёртывать высокопроизводительные AI-агенты на любой инфраструктуре — от локальных компьютеров до облачных кластеров. Nemotron ориентирована на разработчиков, исследователей, предприятия и компании, стремящиеся к созданию надёжных, прозрачных и масштабируемых AI-решений.
Платформа отличается прозрачностью — все модели, данные и методики обучения опубликованы открыто на Hugging Face и GitHub, что обеспечивает полный контроль над процессом разработки. Nemotron включает модели трёх весовых категорий (Nano, Super и Ultra) с поддержкой рассуждений на уровне выпускника, сложных математических вычислений, генерации кода и визуального анализа. Ключевые особенности — гибридная архитектура Transformer-Mamba для максимальной эффективности, конфигурируемые бюджеты мышления для баланса между скоростью и точностью, обучение с FP4 точностью для энергоэффективности и интеграция с NVIDIA NIM для оптимального развёртывания.
Особенности
Ссылки
NVIDIA представила открытую экосистему Nemotron с моделями, данными и рецептами обучения для создания кастомных AI-систем любого масштаба.
Nvidia выпустила компактную языковую модель Nemotron-Nano-9B-V2 с переключаемой функцией логических рассуждений и гибридной архитектурой для эффективного развертывания.