Nemotron

Nemotron — это семейство открытых AI-моделей, наборов данных и технологий от NVIDIA, предназначенное для построения эффективных, точных и специализированных агентных AI-систем. Платформа включает мультимодальные языковые модели с открытыми весами, данными обучения и рецептами оптимизации, позволяя разработчикам и предприятиям создавать и развёртывать высокопроизводительные AI-агенты на любой инфраструктуре — от локальных компьютеров до облачных кластеров. Nemotron ориентирована на разработчиков, исследователей, предприятия и компании, стремящиеся к созданию надёжных, прозрачных и масштабируемых AI-решений.

Платформа отличается прозрачностью — все модели, данные и методики обучения опубликованы открыто на Hugging Face и GitHub, что обеспечивает полный контроль над процессом разработки. Nemotron включает модели трёх весовых категорий (Nano, Super и Ultra) с поддержкой рассуждений на уровне выпускника, сложных математических вычислений, генерации кода и визуального анализа. Ключевые особенности — гибридная архитектура Transformer-Mamba для максимальной эффективности, конфигурируемые бюджеты мышления для баланса между скоростью и точностью, обучение с FP4 точностью для энергоэффективности и интеграция с NVIDIA NIM для оптимального развёртывания.

Особенности

  • Семейство мультимодальных моделей Nano, Super и Ultra с гибридной архитектурой Transformer-Mamba для 6-20x более высокой пропускной способности вывода по сравнению с традиционными моделями
  • Рассуждение уровня выпускника с поддержкой сложных математических вычислений, написания кода на 40+ языках программирования и решения задач на 50+ языках
  • Открытые наборы данных для предварительного и последующего обучения с публикацией методик и рецептов, позволяющих создавать пользовательские специализированные модели
  • Конфигурируемые режимы мышления для контролирования глубины рассуждений и балансирования между качеством ответов и операционными затратами
  • Интеграция с NVIDIA NIM для оптимизированного развёртывания с максимальной производительностью вывода и гибкими опциями развёртывания на любой инфраструктуре
  • Обучение с FP4 точностью на GPU Blackwell с Transformer Engine для энергоэффективного обучения без потери интеллектуальных возможностей
  • Мультимодальные возможности с поддержкой визуального анализа и обработки длинных контекстов до 128 000 токенов для сложных задач

Ссылки

Новости

Olmo Hybrid 7B

Институт Аллена выпустил новую версию гибридной модели Olmo Hybrid 7B

Архитектура Olmo Hybrid демонстрирует двукратный прирост эффективности обучения, однако проблемы с открытым ПО и инференсом мешают массовому внедрению технологии.

NVIDIA выпустила Nemotron 3 Nano

NVIDIA выпустила Nemotron 3 Nano — компактную эффективную языковую модель для агентов

NVIDIA анонсировала Nemotron 3 Nano — компактную языковую модель с гибридной архитектурой Mamba-Transformer MoE и контекстом в 1 млн токенов, предназначенную для создания эффективных ИИ-агентов.

NVIDIA Nemotron открывает исходники

NVIDIA Nemotron открывает исходники моделей и данных для ускорения развития ИИ

NVIDIA представила открытую экосистему Nemotron с моделями, данными и рецептами обучения для создания кастомных AI-систем любого масштаба.

Nvidia выпустила компактную модель Nemotron-Nano с переключаемой логикой

Nvidia выпустила компактную языковую модель Nemotron-Nano-9B-V2 с переключаемой функцией логических рассуждений и гибридной архитектурой для эффективного развертывания.