Veo

Veo — продвинутая текст-видео генеративная модель от Google DeepMind, анонсированная в 2024 году. Veo умеет создавать короткие видеоролики на основе текстовых или визуальных промптов с высоким качеством, реалистичной анимацией, плавной кинематографической динамикой и синхронизированным звуком. Модель прошла несколько этапов развития: Veo 2 добавил поддержку 4K и улучшенную физику, а Veo 3 — синтез аудио (диалоги, эффекты, атмосфера) и расширенные возможности управления видеоконтентом.

С Veo можно быстро создавать видеоклипы с использованием кинематографических терминов (например, «широкий план», «золотой час»), что ускоряет работу с видео для маркетинга, образовательных проектов и развлечений. Модель интегрирована в Google AI Studio и платформу Vertex AI, доступна через облачные сервисы Google с контролем качества и безопасности создания контента.

Особенности:

  • Генерация коротких видео высокой четкости (до 1080p и 4K) из текста или изображений.
  • Точная кинематографическая стилизация, учет движений камеры и освещения.
  • Синтез нативного аудио: диалоги, звуковые эффекты и окружающая атмосфера.
  • Поддержка форматов 16:9 (альбомный) и 9:16 (портретный) для социальных платформ.
  • Возможность расширения и анимации существующих видео и изображений.
  • Интеграция с Google AI Studio и облачной платформой Vertex AI.
  • Безопасность и прозрачность: технологии идентификации AI-контента (SynthID).
  • Использование в маркетинге, образовании, игровой индустрии и прототипировании видео.

Ссылки:

Новости

CraftStory генерирует видео до 5 минут

Основатели OpenCV создали стартап для генерации видео длиной до 5 минут

Стартап CraftStory от создателей OpenCV представил технологию генерации видео до 5 минут, используя параллельную диффузионную архитектуру вместо традиционных последовательных методов.

ElevenLabs запускает генерацию изображений

ElevenLabs запускает платформу для создания изображений и видео с ИИ

ElevenLabs расширяет свою платформу, добавляя инструменты для создания изображений и видео с ИИ. Новая функция объединяет ведущие модели визуального контента с голосовыми технологиями компании.

Together AI добавляет 40 моделей

Together AI расширяет платформу 40 моделями для генерации изображений и видео

Together AI расширяет платформу 40+ моделями для генерации изображений и видео, включая Sora 2, Google Veo 3.0 и ByteDance Seedance. Единые API для текста, изображений и видео упрощают разработку мультимодальных приложений.

Google AI Studio запустила Build

Google запустила автоматическую сборку приложений на базе ИИ

Google AI Studio получил обновление с автоматической сборкой приложений через текстовые запросы. Система позволяет создавать работающие веб-приложения за минуты без навыков программирования.

Google выпускает Veo 3.1

Google выпускает Veo 3.1 с расширенными возможностями редактирования видео

Google DeepMind представила Veo 3.1 с поддержкой аудио и расширенными функциями редактирования видео, включая создание сцен из референсов и длинных непрерывных роликов.

DeepMind предсказывает революцию видео-моделей

DeepMind предсказывает революцию видео-моделей в компьютерном зрении

Google DeepMind заявляет, что видео-модели типа Veo 3 могут стать универсальным решением для компьютерного зрения, аналогичным тому, как LLM стали революцией в сфере обработки текста.