Оглавление
Пока одни обсуждают генерацию текста и картинок, настоящая революция происходит в создании целых вселенных. World Models — новый класс генеративных систем, способных создавать полноценные 3D-миры с физикой, объектами и обитателями, пишет Forbes.
Как работают модели «мира»
Существует два принципиально разных подхода к созданию виртуальных сред. Первый — динамическая генерация в реальном времени, аналогичная работе видео-моделей. Система предсказывает изменения каждого кадра на основе понимания физики и поведения объектов, реагируя на действия пользователя.
Второй подход преобразует промпты в персистентные геометрические модели и метаданные, которые можно импортировать в другие инструменты для редактирования и исследования.
Динамическая генерация выглядит эффектно, но её вычислительная стоимость ограничивает продолжительность сессий несколькими минутами. Пока это скорее технологический демонстратор, чем практический инструмент — примерно как первые GPT, которые могли генерировать пару абзацев вменяемого текста.
Ключевые игроки на поле
За развитием технологии стоят ведущие компании:
- Google с платформой Genie 3 — динамические миры, сохраняющие целостность несколько минут
- Meta* разрабатывает Habitat 3 для тренировки роботов в виртуальных средах
- World Labs Фэй-Фэй Ли создаёт персистентные 3D-миры через Marble
- xAI Илона Маска работает над собственной моделью для игр и робототехники
Практическое применение
Возможности использования выходят далеко за рамки развлечений:
- Медицинские симуляции — цифровые двойники клинических environments
- Тренировка промышленных роботов и автономных систем
- Архитектурное проектирование и тестирование физических свойств зданий
- Фармацевтические исследования — моделирование молекулярных взаимодействий
Путь к искусственному общему интеллекту
Эксперты Google DeepMind считают мировые модели ключевым шагом к AGI. Чтобы понимать реальный мир, ИИ должен научиться его моделировать — понимать структуру, физику и взаимодействия. World Models дают эту способность, дополняя языковые и визуальные возможности.
Технология пока находится на ранней стадии, но её потенциал для бизнеса и науки трудно переоценить. Осталось решить проблему вычислительной эффективности — и мы получим инструмент, который изменит всё: от игровой индустрии до фундаментальных научных исследований.
*Meta признана экстремистской и запрещена в РФ
Оставить комментарий