Together AI расширяет платформу 40+ моделями для генерации изображений и видео, включая Sora 2, Google Veo 3.0 и ByteDance Seedance. Единые API для текста, изображений и видео упрощают разработку мультимодальных приложений.
Google AI Studio получил обновление с автоматической сборкой приложений через текстовые запросы. Система позволяет создавать работающие веб-приложения за минуты без навыков программирования.
Google DeepMind представила Veo 3.1 с поддержкой аудио и расширенными функциями редактирования видео, включая создание сцен из референсов и длинных непрерывных роликов.
Google DeepMind заявляет, что видео-модели типа Veo 3 могут стать универсальным решением для компьютерного зрения, аналогичным тому, как LLM стали революцией в сфере обработки текста.
YouTube анонсировал набор AI-инструментов для создания Shorts, включая кастомную версию Veo 3, ремикширование аудио и автоматизацию монтажа.
Технологии генерации видео ИИ развиваются от диффузионных моделей к сложным пространственно-временным архитектурам, но сталкиваются с проблемами временной согласованности.