Together AI

Together AI — облачная платформа для запуска и масштабирования открытых генеративных моделей. Доступны serverless-инференс, выделенные эндпоинты на собственных GPU и частные кластеры. API совместим с OpenAI (chat/vision/embeddings/images/speech), поэтому миграция сводится к смене базового URL и ключа. В каталоге — сотни OSS-моделей (Llama, DeepSeek, FLUX и др.), есть веб-интерфейс Together Chat и готовые SDK.

Поддерживается дообучение (SFT/DPO; LoRA/Full), контроль версий и метрики; тарификация — «за токены» на fine-tuning/инференс и поминутная для выделенных инстансов. Подходит для быстрых прототипов и высоконагруженных продакшн-сценариев, где важны предсказуемые задержки, приватность и переносимость между OSS-моделями.

  • Serverless инференс и playground
  • Fine-tuning и деплой своих чекпойнтов
  • Выделенные эндпоинты и варианты под VPC
  • OpenAI-совместимые клиенты и SDK

Документация сервиса.

Новости

Together AI делится опытом создания агентов для автоматизации сложных инженерных задач

Together AI сообщает о разработке системы AI-агентов для автоматизации сложных инженерных рабочих процессов.