Meta лицензирует технологии Midjourney для усиления генеративного ИИ
Meta* заключила партнерство с Midjourney для лицензирования технологий генерации изображений и видео, усиливая конкуренцию с OpenAI и Google в области генеративного ИИ.
Sora — это инновационная нейросеть от OpenAI для генерации реалистичного Full HD-видео из текстовых описаний, изображений и референсов, способная создавать клипы до 1 минуты с высокой детализацией, сложной сценографией, динамикой движения, физикой объектов и синхронизированным звуком. Sora открыта широкой аудитории с марта 2024 года на ChatGPT Plus/Pro и доступна разработчикам через API.
Архитектурно Sora — это диффузионная модель с технологией пространственно-временных патчей, оптимизированная для последовательности кадров. Возможности: генерация и анимация сцен и объектов из текстового промпта, расширение видео, анимирование статичных изображений, сцепление и стилизация клипов. Sora моделирует сложные взаимодействия персонажей, поддерживает многокамерную съемку, нелинейную динамику, кастомизацию стилей (cinematic, аниме, вертикальные видео), экспорт в 4K/8K (в roadmap), симулирует физику объектов и позволяет вносить правки через текстовые инструкции.
Особенности:
Ссылки:
Meta* заключила партнерство с Midjourney для лицензирования технологий генерации изображений и видео, усиливая конкуренцию с OpenAI и Google в области генеративного ИИ.
OpenAI не показала Sora 2 в анонсе GPT-5, но следующее поколение генератора видео может стать самым значительным прорывом в области AI-видео с улучшенным физическим реализмом и когерентностью.
Tencent выпустила открытую ИИ-систему Hunyuan-GameCraft, которая преобразует статичные изображения в интерактивные 3D-миры с управлением от первого лица.