Оглавление
Google DeepMind представила масштабное обновление своей системы генерации видео Veo до версии 3.1, добавив аудио поддержку и более точный контроль над созданием контента, сообщает DeepMind.
Новые возможности творческого контроля
С момента запуска инструмента для создания видео Flow пять месяцев назад пользователи сгенерировали более 275 миллионов видео. Теперь система получает существенные улучшения, ориентированные на предоставление большего художественного контроля.
Veo 3.1 представляет собой модель передового уровня, которая обеспечивает лучшее следование промптам и улучшенное аудиовизуальное качество при преобразовании изображений в видео.
Расширенная работа с аудио и нарративом
Ключевым нововведением стало добавление аудио поддержки к существующим функциям. Теперь пользователи могут:
- Создавать сцену из нескольких референсов с помощью «Ingredients to Video» — использовать несколько эталонных изображений для контроля персонажей, объектов и стиля
- Управлять кадром от начала до конца через «Frames to Video» — предоставлять начальное и конечное изображения для создания плавного видео с переходом между ними
- Создавать длинные непрерывные сцены с функцией «Extend» — генерировать видео продолжительностью минуту и более, продолжая действие из исходного клипа
Точное редактирование сцена и объектов
Для случаев, когда первая попытка создания видео не является окончательной, в Flow добавлены новые возможности редактирования:
- Добавление новых элементов в любую сцену с помощью «Insert» — от реалистичных деталей до фантастических существ, с учетом теней и освещения
- Удаление нежелательных объектов — система реконструирует фон и окружение, делая так, будто объект никогда не существовал
Интеграция аудио в генеративные модели видео — это логичный следующий шаг, но настоящая ценность в том, как DeepMind решает проблему последовательного контроля над сценами. Возможность создавать длинные видео с сохранением контекста — это именно то, что нужно рынку, чтобы перейти от коротких клипов к полноценному контенту. Интересно, насколько стабильно это будет работать за пределами демо-примеров.
Новая модель Veo 3.1 доступна через Gemini API для разработчиков, Vertex AI для корпоративных клиентов и в приложении Gemini.
Оставить комментарий