Veo

Veo — семейство моделей Google DeepMind для генерации видео по тексту и изображениям. Актуальная Veo 3 умеет нативно создавать звук (диалоги, эффекты, амбиент), уделяя внимание физике сцены и следованию промпту. Доступ предлагается через интерфейсы Google (Gemini) и для разработчиков — в экосистеме Google Cloud.

Для продакшн-интеграций доступен Vertex AI: текст-/изображение-в-видео, контроль политик и водяных знаков, а также стандартные инструменты безопасности. В Veo 2 на Vertex AI применяется поминутно-посекундная тарификация; Veo 3 доступна в потребительских планах Gemini с короткими клипами.

  • Text-to-Video и Image-to-Video; упор на реализм и «кинематографичность» сцены.
  • Veo 3: генерация нативного аудио (речь, звуки, амбиент).
  • Доступ: Gemini (видео-генерация) и Vertex AI для разработчиков.
  • Политики/одобрения для контента с людьми, маркировка SynthID.
  • Veo 2 в Vertex AI: посекундная оплата (примерная ставка $0.50/с).

Источники:

Новости

В Google Photos теперь будет функция генерации видео из фото через Veo 3

Google интегрирует модель генерации видео Veo 3 в Photos, позволяя превращать статичные фото в короткие видео. Пока доступно только в США с ограничениями.