NVIDIA выпустила обновление Isaac GR00T N1.5 — первой открытой фундаментальной модели для гуманоидных роботов, способной обрабатывать мультимодальные данные. Как сообщает Hugging Face, новинка позволяет адаптировать модель под конкретные роботизированные платформы, включая бюджетный манипулятор LeRobot SO-101.
Технологическая основа
GR00T N1.5 использует систему EmbodimentTag, которая обеспечивает кастомизацию под различные аппаратные конфигурации. Это позволяет исследователям и инженерам переносить возможности продвинутого планирования движений на собственные устройства.

Практическая реализация
Процесс адаптации включает четыре этапа:
- Подготовка среды: установка Python 3.10 и специализированных библиотек вроде Flash-Attn
- Работа с данными: использование датасетов Hugging Face или создание собственных через инструкции
- Дообучение модели: оптимизация под конкретную задачу (например, уборка стола)
- Деплой: запуск через inference-сервис для управления физическим роботом
Технические особенности
- Требования: 25 ГБ VRAM для полной настройки (с опцией снижения через флаг
--no-tune_diffusion_model
) - Поддержка конфигураций: single/dual-camera через файлы
modality.json
- Тестирование: open-loop оценка через
eval_policy.py
перед развертыванием
Этот релиз — тактический ход NVIDIA для захвата ниши open-source робототехники. Хотя 25 ГБ VRAM ставят барьер для энтузиастов, сама возможность адаптации foundation-модели к бюджетному железу вроде SO-101 меняет правила игры. Важно: технология EmbodimentTag снижает порог входа для университетских лабораторий, но в регионах с ограниченным доступом к GPU это останется теоретическим упражнением. Реальный тест — массовые кейсы вне стен NVIDIA.
Полное техническое руководство доступно в блоге NVIDIA Research.
По материалам сайта Hugging Face.
Оставить комментарий