Replicate

Replicate — облачная платформа для запуска ML-моделей через REST API и официальные SDK. Запуск оформляется как «prediction» с вводами/выводами и статусами; поддерживаются синхронный и асинхронный режимы. Есть официальные клиенты для Python/Node/Go/Swift.

Полезно, когда нужно быстро интегрировать генеративные модели без своей инфраструктуры: доступен стриминг вывода (SSE) для токенов/логов, вебхуки для событий, а также обучение/тонкая настройка (например LoRA для FLUX.1). Оплата — за фактическое время выполнения на выбранном «железе».

  • HTTP API для предсказаний: POST /v1/models/{owner}/{name}/predictions (async/sync).
  • Стриминг вывода через Server-Sent Events (SSE).
  • Вебхуки для статусов/логов/вывода; проверка подписи.
  • Обучение/финетюнинг (напр., FLUX.1 LoRA) и публикация моделей.
  • Тарификация по секундам в зависимости от GPU/типа железа.

Источники:

Записей не найдено.