По данным Hugging Face, теперь разработчики могут дообучать любые совместимые модели из своего каталога с помощью инфраструктуры Together AI. Это устраняет ключевое препятствие — необходимость самостоятельной настройки сложных вычислительных сред для тонкой настройки моделей.
Техническая реализация
Новая интеграция работает по принципу «двух моделей»: базовая модель из каталога Together AI служит шаблоном для конфигурации инфраструктуры, а пользовательская модель с Hugging Face Hub подвергается фактическому дообучению. Это позволяет системе оптимально распределять ресурсы GPU и настраивать тренировочный конвейер.
Пример кода для запуска процесса:
from together import Together
client = Together(api_key="your-api-key")
file_upload = client.files.upload("sft_examples.jsonl", check=True)
job = client.fine_tuning.create(
model="togethercomputer/llama-2-7b-chat",
from_hf_model="HuggingFaceTB/SmolLM2-1.7B-Instruct",
training_file=file_upload.id,
n_epochs=3,
learning_rate=1e-5,
hf_api_token="hf_***",
hf_output_repo_name="my-username-org/SmolLM2-1.7B-FT"
)
Практическое применение
Ранние пользователи уже демонстрируют впечатляющие результаты:
- Slingshot AI интегрировали функциональность в свой конвейер разработки моделей
- Parsed показали, что небольшие дообученные модели могут превосходить крупные закрытые аналоги
- Адаптация моделей для специфических доменов: медицина, финансы, юридическая сфера
Интеграция решает реальную проблему — находишь крутую модель на Hugging Face, но нет инфраструктуры для её дообучения. Теперь от обнаружения перспективной модели до её кастомизации проходят считанные минуты, а не дни. Правда, магия работает только если архитектуры моделей совместимы — волшебной палочки для трансформации CNN в Transformer пока не придумали.
Что это меняет для разработчиков
Главное преимущество — снижение порога входа. Вместо настройки собственной инфраструктуры можно экспериментировать с любыми совместимыми моделями через несколько API-вызовов. Поддерживаются как публичные репозитории, так и приватные (с указанием токена).
После обучения модель можно развернуть для вывода, скачать или автоматически загрузить обратно на Hugging Face Hub — полный цикл разработки в одном инструменте.
Оставить комментарий