Replicate
Replicate — облачная платформа для запуска ML-моделей через REST API и официальные SDK. Запуск оформляется как «prediction» с вводами/выводами и статусами; поддерживаются синхронный и асинхронный режимы. Есть официальные клиенты для Python/Node/Go/Swift.
Полезно, когда нужно быстро интегрировать генеративные модели без своей инфраструктуры: доступен стриминг вывода (SSE) для токенов/логов, вебхуки для событий, а также обучение/тонкая настройка (например LoRA для FLUX.1). Оплата — за фактическое время выполнения на выбранном «железе».
- HTTP API для предсказаний:
POST /v1/models/{owner}/{name}/predictions(async/sync). - Стриминг вывода через Server-Sent Events (SSE).
- Вебхуки для статусов/логов/вывода; проверка подписи.
- Обучение/финетюнинг (напр., FLUX.1 LoRA) и публикация моделей.
- Тарификация по секундам в зависимости от GPU/типа железа.
Источники:
Записей не найдено.