Google DeepMind заявляет, что видео-модели типа Veo 3 могут стать универсальным решением для компьютерного зрения, аналогичным тому, как LLM стали революцией в сфере обработки текста.
YouTube анонсировал набор AI-инструментов для создания Shorts, включая кастомную версию Veo 3, ремикширование аудио и автоматизацию монтажа.
Технологии генерации видео ИИ развиваются от диффузионных моделей к сложным пространственно-временным архитектурам, но сталкиваются с проблемами временной согласованности.
Google обновил Veo 3: добавлена поддержка вертикального видео 9:16 и разрешения 1080p, а цены снижены на 50%. Адаптация под мобильный контент и соцсети.
Google интегрирует модель генерации видео Veo 3 в Photos, позволяя превращать статичные фото в короткие видео. Пока доступно только в США с ограничениями.