Оглавление

NVIDIA выпустила обновление Isaac GR00T N1.5 — первой открытой фундаментальной модели для гуманоидных роботов, способной обрабатывать мультимодальные данные. Как сообщает Hugging Face, новинка позволяет адаптировать модель под конкретные роботизированные платформы, включая бюджетный манипулятор LeRobot SO-101.

Технологическая основа

GR00T N1.5 использует систему EmbodimentTag, которая обеспечивает кастомизацию под различные аппаратные конфигурации. Это позволяет исследователям и инженерам переносить возможности продвинутого планирования движений на собственные устройства.

Обзор платформы NVIDIA Isaac GR00T для роботов-манипуляторов
Источник: huggingface.co

Практическая реализация

Процесс адаптации включает четыре этапа:

  1. Подготовка среды: установка Python 3.10 и специализированных библиотек вроде Flash-Attn
  2. Работа с данными: использование датасетов Hugging Face или создание собственных через инструкции
  3. Дообучение модели: оптимизация под конкретную задачу (например, уборка стола)
  4. Деплой: запуск через inference-сервис для управления физическим роботом

Технические особенности

  • Требования: 25 ГБ VRAM для полной настройки (с опцией снижения через флаг --no-tune_diffusion_model)
  • Поддержка конфигураций: single/dual-camera через файлы modality.json
  • Тестирование: open-loop оценка через eval_policy.py перед развертыванием

Этот релиз — тактический ход NVIDIA для захвата ниши open-source робототехники. Хотя 25 ГБ VRAM ставят барьер для энтузиастов, сама возможность адаптации foundation-модели к бюджетному железу вроде SO-101 меняет правила игры. Важно: технология EmbodimentTag снижает порог входа для университетских лабораторий, но в регионах с ограниченным доступом к GPU это останется теоретическим упражнением. Реальный тест — массовые кейсы вне стен NVIDIA.

Полное техническое руководство доступно в блоге NVIDIA Research.

По материалам сайта Hugging Face.