Veo

Veo — семейство моделей Google DeepMind для генерации видео по тексту и изображениям. Актуальная Veo 3 умеет нативно создавать звук (диалоги, эффекты, амбиент), уделяя внимание физике сцены и следованию промпту. Доступ предлагается через интерфейсы Google (Gemini) и для разработчиков — в экосистеме Google Cloud.

Для продакшн-интеграций доступен Vertex AI: текст-/изображение-в-видео, контроль политик и водяных знаков, а также стандартные инструменты безопасности. В Veo 2 на Vertex AI применяется поминутно-посекундная тарификация; Veo 3 доступна в потребительских планах Gemini с короткими клипами.

  • Text-to-Video и Image-to-Video; упор на реализм и «кинематографичность» сцены.
  • Veo 3: генерация нативного аудио (речь, звуки, амбиент).
  • Доступ: Gemini (видео-генерация) и Vertex AI для разработчиков.
  • Политики/одобрения для контента с людьми, маркировка SynthID.
  • Veo 2 в Vertex AI: посекундная оплата (примерная ставка $0.50/с).

Источники:

Новости

Together AI добавляет 40 моделей

Together AI расширяет платформу 40 моделями для генерации изображений и видео

Together AI расширяет платформу 40+ моделями для генерации изображений и видео, включая Sora 2, Google Veo 3.0 и ByteDance Seedance. Единые API для текста, изображений и видео упрощают разработку мультимодальных приложений.

Google AI Studio запустила Build

Google запустила автоматическую сборку приложений на базе ИИ

Google AI Studio получил обновление с автоматической сборкой приложений через текстовые запросы. Система позволяет создавать работающие веб-приложения за минуты без навыков программирования.

Google выпускает Veo 3.1

Google выпускает Veo 3.1 с расширенными возможностями редактирования видео

Google DeepMind представила Veo 3.1 с поддержкой аудио и расширенными функциями редактирования видео, включая создание сцен из референсов и длинных непрерывных роликов.

DeepMind предсказывает революцию видео-моделей

DeepMind предсказывает революцию видео-моделей в компьютерном зрении

Google DeepMind заявляет, что видео-модели типа Veo 3 могут стать универсальным решением для компьютерного зрения, аналогичным тому, как LLM стали революцией в сфере обработки текста.

YouTube представил набор инструментов на базе ИИ для видеосервисов

YouTube анонсировал набор AI-инструментов для создания Shorts, включая кастомную версию Veo 3, ремикширование аудио и автоматизацию монтажа.

Как ИИ-модели генерируют видео

Как нейросети создают видео: от диффузионных моделей до временной согласованности

Технологии генерации видео ИИ развиваются от диффузионных моделей к сложным пространственно-временным архитектурам, но сталкиваются с проблемами временной согласованности.