Оглавление

Компания ElevenLabs, известная своими передовыми решениями в области генерации голоса, расширяет функциональность платформы, добавив инструменты для работы с изображениями и видео. Новая функция ElevenLabs Image & Video (Beta) объединяет лучшие модели визуального контента с уже существующими аудиотехнологиями компании.

Единый рабочий процесс для креаторов

Платформа теперь позволяет создавать контент от идеи до финального экспорта в рамках единого рабочего процесса. Пользователи могут генерировать изображения и видео с помощью таких моделей, как Veo, Sora, Kling, Wan и Seedance, а затем добавлять к ним голосовые озвучки, музыку и звуковые эффекты от ElevenLabs.

Видео редактируется в студии ElevenLabs
Источник: elevenlabs.io

Интеграция ведущих моделей

В новой системе доступны:

  • Создание статичных изображений с помощью моделей Nanobanana, Flux Kontext, GPT Image и Seedream
  • Генерация видео через интегрированные модели Veo, Sora, Kling, Wan и Seedance
  • Функция синхронизации губ для созданных видео с использованием голосов ElevenLabs
  • Возможность улучшения качества изображений и видео
  • Создание сторибордов, миниатюр и исходных материалов для видеопроектов
Поле ввода запроса, окруженное сгенерированными изображениями
Источник: elevenlabs.io

Редактирование в Studio

После создания визуальной части пользователи могут экспортировать проект в Studio для финальной обработки. Здесь доступны:

  • Добавление выразительных голосовых дорожек из библиотеки или собственных клонов голосов
  • Создание фоновой музыки и звуковых эффектов
  • Корректировка времени и синхронизации на единой временной шкале
  • Экспорт готового к использованию видео

Целевая аудитория

Новый функционал ориентирован на создателей контента различного профиля: от кинематографистов и фрилансеров до маркетологов и преподавателей. Платформа предоставляет полный набор инструментов для создания промо-роликов, контента для социальных сетей и образовательных материалов.

Интересно наблюдать, как компании переходят от узкоспециализированных решений к созданию комплексных экосистем. ElevenLabs, начинавшая с генерации голоса, теперь пытается стать универсальной платформой для создания мультимедийного контента. Вопрос в том, сможет ли она конкурировать с гигантами вроде Adobe или Runway, которые уже имеют устоявшиеся позиции на рынке. Интеграция сторонних моделей выглядит разумным ходом — вместо разработки собственных решений с нуля компания фокусируется на создании удобного интерфейса поверх существующих технологий.

Этот запуск знаменует важный шаг к созданию по-настоящему мультимодальных инструментов, где каждый элемент — от визуала до звука — может быть сгенерирован, отредактирован и улучшен в единой среде.

Новый функционал доступен в Creative Platform от ElevenLabs и находится в бета-тестировании. Image & Video уже можно опробовать на официальном сайте компании.

По материалам ElevenLabs.