Исследователи предлагают не считать ИИ-генераторы видео «мировыми моделями»
Международная группа ученых представила OpenWorldLib и доказала, что популярные видеогенераторы вроде Sora лишены ключевых свойств моделей мира.
Veo — продвинутая текст-видео генеративная модель от Google DeepMind, анонсированная в 2024 году. Veo умеет создавать короткие видеоролики на основе текстовых или визуальных промптов с высоким качеством, реалистичной анимацией, плавной кинематографической динамикой и синхронизированным звуком. Модель прошла несколько этапов развития: Veo 2 добавил поддержку 4K и улучшенную физику, а Veo 3 — синтез аудио (диалоги, эффекты, атмосфера) и расширенные возможности управления видеоконтентом.
С Veo можно быстро создавать видеоклипы с использованием кинематографических терминов (например, «широкий план», «золотой час»), что ускоряет работу с видео для маркетинга, образовательных проектов и развлечений. Модель интегрирована в Google AI Studio и платформу Vertex AI, доступна через облачные сервисы Google с контролем качества и безопасности создания контента.
Особенности:
Ссылки:
Международная группа ученых представила OpenWorldLib и доказала, что популярные видеогенераторы вроде Sora лишены ключевых свойств моделей мира.
Стартап CraftStory от создателей OpenCV представил технологию генерации видео до 5 минут, используя параллельную диффузионную архитектуру вместо традиционных последовательных методов.
ElevenLabs расширяет свою платформу, добавляя инструменты для создания изображений и видео с ИИ. Новая функция объединяет ведущие модели визуального контента с голосовыми технологиями компании.
Together AI расширяет платформу 40+ моделями для генерации изображений и видео, включая Sora 2, Google Veo 3.0 и ByteDance Seedance. Единые API для текста, изображений и видео упрощают разработку мультимодальных приложений.
Google AI Studio получил обновление с автоматической сборкой приложений через текстовые запросы. Система позволяет создавать работающие веб-приложения за минуты без навыков программирования.
Google DeepMind представила Veo 3.1 с поддержкой аудио и расширенными функциями редактирования видео, включая создание сцен из референсов и длинных непрерывных роликов.