Sora

Sora — это инновационная нейросеть от OpenAI для генерации реалистичного Full HD-видео из текстовых описаний, изображений и референсов, способная создавать клипы до 1 минуты с высокой детализацией, сложной сценографией, динамикой движения, физикой объектов и синхронизированным звуком. Sora открыта широкой аудитории с марта 2024 года на ChatGPT Plus/Pro и доступна разработчикам через API.

Архитектурно Sora — это диффузионная модель с технологией пространственно-временных патчей, оптимизированная для последовательности кадров. Возможности: генерация и анимация сцен и объектов из текстового промпта, расширение видео, анимирование статичных изображений, сцепление и стилизация клипов. Sora моделирует сложные взаимодействия персонажей, поддерживает многокамерную съемку, нелинейную динамику, кастомизацию стилей (cinematic, аниме, вертикальные видео), экспорт в 4K/8K (в roadmap), симулирует физику объектов и позволяет вносить правки через текстовые инструкции.

Особенности:

  • Генерация Full HD видео до 60 сек. по текстовому/изображенческому промпту
  • Анимация статичных картинок и расширение существующего видео
  • Симуляция реальной физики, динамика, многоплановые сцены и движения камеры
  • Синхронизированный аудио-саундтрек (диалоги, эффекты, атмосфера)
  • Интерполяция и склейка кадров, редактирование стилей и среды видео текстом
  • Поддержка multi-style: кино, аниме, синематик, вертикальные соц. видео
  • Возможность интеграции и экспорта в 4K+ (roadmap), видео-to-видео редакция

Ссылки:

Новости

OpenAI запустила Sora 2

OpenAI запустила Sora 2: где и как испытать новую модель генерации видео

OpenAI анонсировала Sora 2 — улучшенную версию модели для генерации видео по тексту с повышенным качеством, длительностью роликов и пониманием промптов. Доступ через лист ожидания.

OpenAI запускает Sora 2

OpenAI запускает Sora 2 — приложение для генерации видео в стиле TikTok

OpenAI запустила Sora 2 — приложение для генерации коротких видео с помощью ИИ, позиционируемое как конкурент TikTok с полностью искусственным контентом.

Как ИИ-модели генерируют видео

Как нейросети создают видео: от диффузионных моделей до временной согласованности

Технологии генерации видео ИИ развиваются от диффузионных моделей к сложным пространственно-временным архитектурам, но сталкиваются с проблемами временной согласованности.

Meta лицензирует технологии Midjourney для усиления генеративного ИИ

Meta* заключила партнерство с Midjourney для лицензирования технологий генерации изображений и видео, усиливая конкуренцию с OpenAI и Google в области генеративного ИИ.

Отсутствие Sora 2 в анонсе GPT-5 может означать потенциальный прорыв в генерации видео

OpenAI не показала Sora 2 в анонсе GPT-5, но следующее поколение генератора видео может стать самым значительным прорывом в области AI-видео с улучшенным физическим реализмом и когерентностью.

Tencent представила ИИ-систему для создания интерактивных игровых миров из одного изображения

Tencent выпустила открытую ИИ-систему Hunyuan-GameCraft, которая преобразует статичные изображения в интерактивные 3D-миры с управлением от первого лица.