Оглавление

Платформа Together AI существенно расширила свои возможности, добавив более 40 моделей для генерации изображений и видео. Это превращает сервис из специализированного инструмента для работы с текстом в полноценную мультимодальную инфраструктуру для разработчиков.

Единая платформа для всех типов генеративного контента

Генеративные медиа находятся в центре нового поколения AI-приложений — от видеоредакторов с искусственным интеллектом и персонализированных игровых впечатлений до автоматизированного маркетингового контента. Однако создание таких приложений до сих пор оставалось сложной задачей: разработчикам приходилось работать с разными провайдерами для текста, изображений и видео, каждый со своими SDK, системами аутентификации, лимитами и тарифами.

Together AI решает эту проблему через стратегическое партнерство с Runware, интегрируя более 20 видео-моделей от шести поставщиков, включая Google Veo 3.0, OpenAI Sora 2 и ByteDance Seedream, а также 15+ моделей для генерации изображений вместе с ведущими языковыми моделями и голосовыми технологиями.

Интеграция видео-генерации в существующую инфраструктуру — это серьезный шаг к консолидации рынка. Вместо того чтобы выбирать между десятком специализированных сервисов, разработчики получают единый инструмент с предсказуемой ценовой политикой. Интересно, насколько это изменит ландшафт конкуренции среди облачных AI-провайдеров.

Новые модели для генерации видео

Видеогенерация — новое направление для Together AI. Стартовый набор включает модели, создающие видео длительностью от 4 до 30 секунд с различным разрешением и стилями. Каждая модель оптимизирована под разные потребности — реализм, согласованность движения или увеличенная продолжительность.

  • Sora 2 Pro — премиальная кинематографическая видеогенерация с нативным аудио и реалистичной физикой. Цена: $2.40/видео (720p/8s)
  • Google Veo 3 — создание высококачественного видео с продвинутыми движениями камеры и контролем сцены. Цена: $1.60/видео (720p/8s)
  • PixVerse V5 — быстрая и доступная видеогенерация с плавным движением и множеством художественных стилей. Цена: $0.30/видео (1080p/5s)
  • ByteDance Seedance 1.0 Pro — видеогенерация высшего класса с многосценовым повествованием и кинематографическим качеством. Цена: $0.57/видео (1080p/5s)

Модели для генерации и редактирования изображений

Возможности генерации изображений охватывают полный спектр творческих и производственных потребностей — от фотореалистичной генерации с Google Imagen до художественного контроля с такими моделями, как Nano Banana.

Ключевые модели

Gemini Flash Image 2.5 (Nano Banana) — универсальное создание и редактирование изображений с контролем на естественном языке. Цена: $0.039/изображение

Google Imagen 4.0 Ultra — премиальная генерация изображений с исключительной детализацией и рендерингом текста. Цена: $0.06/изображение

Qwen Image — высококачественная генерация изображений с идеальной интеграцией текста и дизайном постеров. Цена: $0.0058/изображение

34+ других моделей — полный спектр специализированных моделей для каждого творческого и производственного случая использования. От $0.0006/изображение

Практические сценарии применения

Объединение генерации текста, изображений и видео в единой кодовой базе открывает новые возможности для разработчиков.

Генерация медиа в играх

Игровые студии могут генерировать окружающие ассеты, вариации персонажей и кат-сцены программно на основе данных геймплея. Преимущество платформы: единая цепочка API-вызовов от состояния игры до визуальных ассетов, позволяющая генерировать контент в реальном времени без управления несколькими провайдерами.

Динамическая реклама

E-commerce платформы могут генерировать персонализированные изображения продуктов, lifestyle-снимки и видео-рекламу на основе пользовательских предпочтений, сезонных трендов и данных инвентаря. Преимущество: реальная генерация креативов из пользовательских данных в персонализированные визуалы, позволяющая динамическую оптимизацию рекламы без координации отдельных провайдеров изображений и видео.

Интерактивные обучающие платформы

Образовательные приложения могут создавать кастомные визуальные объяснения, интерактивные диаграммы и персонализированный видео-контент на основе вопросов студентов и их прогресса. Преимущество: реальные мультимодальные ответы с использованием той же инфраструктуры вывода, позволяющая сложную персонализацию без потерь на задержках от переключения провайдеров.

Инфраструктура для продакшена

Генеративные медиа-возможности Together AI готовы к продакшену с enterprise-инфраструктурой и инструментами, ориентированными на разработчиков.

  • Производительность и масштабируемость: 40+ моделей изображений и видео, генерация видео до 30 секунд, множественные опции разрешения, прозрачное ценообразование по моделям
  • Инфраструктура: продакшен-гред лимиты, серверное авто-масштабирование, глобальная инфраструктура, enterprise-надежность
  • Опыт разработчика: OpenAI-совместимые API, те же SDK что и для текстовых моделей, унифицированная аутентификация, единая биллинг-платформа

Пример кода для работы с видео


from together import Together

client = Together()

# Create a video generation job
job = client.videos.create(
 prompt="A serene sunset over the ocean with gentle waves",
 model="minimax/video-01-director",
 width=1366,
 height=768,
)

print(f"Job ID: {job.id}")

# Check status
status = client.videos.retrieve(job.id)
print(f"Status: {status.status}")

# When completed, access the video
if status.status == "completed":
 print(f"Video URL: {status.outputs.video_url}")

По сообщению Together AI, платформа теперь предлагает единое решение для всех типов генеративного контента, устраняя необходимость работы с множеством провайдеров и упрощая разработку мультимодальных приложений.