Оглавление

По данным Hugging Face, теперь разработчики могут дообучать любые совместимые модели из своего каталога с помощью инфраструктуры Together AI. Это устраняет ключевое препятствие — необходимость самостоятельной настройки сложных вычислительных сред для тонкой настройки моделей.

Техническая реализация

Новая интеграция работает по принципу «двух моделей»: базовая модель из каталога Together AI служит шаблоном для конфигурации инфраструктуры, а пользовательская модель с Hugging Face Hub подвергается фактическому дообучению. Это позволяет системе оптимально распределять ресурсы GPU и настраивать тренировочный конвейер.

Пример кода для запуска процесса:

from together import Together

client = Together(api_key="your-api-key")
file_upload = client.files.upload("sft_examples.jsonl", check=True)

job = client.fine_tuning.create(
 model="togethercomputer/llama-2-7b-chat",
 from_hf_model="HuggingFaceTB/SmolLM2-1.7B-Instruct",
 training_file=file_upload.id,
 n_epochs=3,
 learning_rate=1e-5,
 hf_api_token="hf_***",
 hf_output_repo_name="my-username-org/SmolLM2-1.7B-FT"
)

Практическое применение

Ранние пользователи уже демонстрируют впечатляющие результаты:

  • Slingshot AI интегрировали функциональность в свой конвейер разработки моделей
  • Parsed показали, что небольшие дообученные модели могут превосходить крупные закрытые аналоги
  • Адаптация моделей для специфических доменов: медицина, финансы, юридическая сфера

Интеграция решает реальную проблему — находишь крутую модель на Hugging Face, но нет инфраструктуры для её дообучения. Теперь от обнаружения перспективной модели до её кастомизации проходят считанные минуты, а не дни. Правда, магия работает только если архитектуры моделей совместимы — волшебной палочки для трансформации CNN в Transformer пока не придумали.

Что это меняет для разработчиков

Главное преимущество — снижение порога входа. Вместо настройки собственной инфраструктуры можно экспериментировать с любыми совместимыми моделями через несколько API-вызовов. Поддерживаются как публичные репозитории, так и приватные (с указанием токена).

После обучения модель можно развернуть для вывода, скачать или автоматически загрузить обратно на Hugging Face Hub — полный цикл разработки в одном инструменте.