Оглавление

Пока одни обсуждают генерацию текста и картинок, настоящая революция происходит в создании целых вселенных. World Models — новый класс генеративных систем, способных создавать полноценные 3D-миры с физикой, объектами и обитателями, пишет Forbes.

Как работают модели «мира»

Существует два принципиально разных подхода к созданию виртуальных сред. Первый — динамическая генерация в реальном времени, аналогичная работе видео-моделей. Система предсказывает изменения каждого кадра на основе понимания физики и поведения объектов, реагируя на действия пользователя.

Второй подход преобразует промпты в персистентные геометрические модели и метаданные, которые можно импортировать в другие инструменты для редактирования и исследования.

Динамическая генерация выглядит эффектно, но её вычислительная стоимость ограничивает продолжительность сессий несколькими минутами. Пока это скорее технологический демонстратор, чем практический инструмент — примерно как первые GPT, которые могли генерировать пару абзацев вменяемого текста.

Ключевые игроки на поле

За развитием технологии стоят ведущие компании:

  • Google с платформой Genie 3 — динамические миры, сохраняющие целостность несколько минут
  • Meta* разрабатывает Habitat 3 для тренировки роботов в виртуальных средах
  • World Labs Фэй-Фэй Ли создаёт персистентные 3D-миры через Marble
  • xAI Илона Маска работает над собственной моделью для игр и робототехники

Практическое применение

Возможности использования выходят далеко за рамки развлечений:

  • Медицинские симуляции — цифровые двойники клинических environments
  • Тренировка промышленных роботов и автономных систем
  • Архитектурное проектирование и тестирование физических свойств зданий
  • Фармацевтические исследования — моделирование молекулярных взаимодействий

Путь к искусственному общему интеллекту

Эксперты Google DeepMind считают мировые модели ключевым шагом к AGI. Чтобы понимать реальный мир, ИИ должен научиться его моделировать — понимать структуру, физику и взаимодействия. World Models дают эту способность, дополняя языковые и визуальные возможности.

Технология пока находится на ранней стадии, но её потенциал для бизнеса и науки трудно переоценить. Осталось решить проблему вычислительной эффективности — и мы получим инструмент, который изменит всё: от игровой индустрии до фундаментальных научных исследований.

*Meta признана экстремистской и запрещена в РФ