Оглавление

Искусственный интеллект стремительно развивается, но ему по-прежнему не хватает того, что люди называют здравым смыслом — базового понимания физических законов мира. NVIDIA решает эту проблему с помощью новой модели Cosmos Reason, которая учит ИИ ориентироваться в реальной среде.

Проблема здравого смысла в ИИ

Хотя людям очевидно, что птицы не летают задом наперед, а лед тает в воду, ИИ-моделям эти принципы необходимо явно обучать. Без такого понимания модели не могут точно отвечать на сложные вопросы и безопасно работать в непредсказуемых физических средах — на складах, дорогах или в промышленных помещениях.

Cosmos Reason: модель физического мышления

NVIDIA Cosmos Reason — это открытая визуальная языковая модель, специально разработанная для физического ИИ. Недавно она возглавила лидерборд физического мышления на Hugging Face.

Ключевые особенности модели:

  • Способность анализировать временные последовательности
  • Прогнозирование вероятных исходов сценариев
  • Объяснение логики принятия решений
  • Применение в робототехнике, автономных транспортных средствах и умных пространствах

Как обучают здравому смыслу

Обучение происходит через обучение с подкреплением на тщательно отобранных данных. Команда NVIDIA Data Factory создает сотни тысяч вопросно-ответных пар на основе реальных видео — от кур в курятнике до машин на дорогах.

Процесс курирования данных включает:

  1. Создание вопросов с множественным выбором на основе видео
  2. Качественную проверку аналитиками
  3. Обучение модели через обучение с подкреплением
  4. Тестирование на способность к логическому выводу

Обучение ИИ физическому здравому смыслу — это не академическое упражнение, а практическая необходимость для безопасного внедрения автономных систем. Подход NVIDIA с тщательным курированием данных и специализированными тестами задает новый стандарт для индустрии.

Практическое применение

Модели рассуждения способны анализировать ситуации, строить логические цепочки и предсказывать наиболее вероятные исходы. Например, при анализе видео двух машин на одной полосе модель может спрогнозировать вероятность столкновения.

«Мы создаем передовую модель рассуждения для физического ИИ», — отмечает Tsung-Yi Lin, ведущий научный сотрудник в NVIDIA.

По материалам NVIDIA Blog.