По данным Hugging Face, теперь разработчики могут дообучать любые совместимые модели из своего каталога с помощью инфраструктуры Together AI. Это устраняет ключевое препятствие — необходимость самостоятельной настройки сложных вычислительных сред для тонкой настройки моделей.
Техническая реализация
Новая интеграция работает по принципу «двух моделей»: базовая модель из каталога Together AI служит шаблоном для конфигурации инфраструктуры, а пользовательская модель с Hugging Face Hub подвергается фактическому дообучению. Это позволяет системе оптимально распределять ресурсы GPU и настраивать тренировочный конвейер.
Пример кода для запуска процесса:
from together import Together client = Together(api_key="your-api-key") file_upload = client.files.upload("sft_examples.jsonl", check=True) job = client.fine_tuning.create( model="togethercomputer/llama-2-7b-chat", from_hf_model="HuggingFaceTB/SmolLM2-1.7B-Instruct", training_file=file_upload.id, n_epochs=3, learning_rate=1e-5, hf_api_token="hf_***", hf_output_repo_name="my-username-org/SmolLM2-1.7B-FT" )
Практическое применение
Ранние пользователи уже демонстрируют впечатляющие результаты:
- Slingshot AI интегрировали функциональность в свой конвейер разработки моделей
- Parsed показали, что небольшие дообученные модели могут превосходить крупные закрытые аналоги
- Адаптация моделей для специфических доменов: медицина, финансы, юридическая сфера
Интеграция решает реальную проблему — находишь крутую модель на Hugging Face, но нет инфраструктуры для её дообучения. Теперь от обнаружения перспективной модели до её кастомизации проходят считанные минуты, а не дни. Правда, магия работает только если архитектуры моделей совместимы — волшебной палочки для трансформации CNN в Transformer пока не придумали.
Что это меняет для разработчиков
Главное преимущество — снижение порога входа. Вместо настройки собственной инфраструктуры можно экспериментировать с любыми совместимыми моделями через несколько API-вызовов. Поддерживаются как публичные репозитории, так и приватные (с указанием токена).
После обучения модель можно развернуть для вывода, скачать или автоматически загрузить обратно на Hugging Face Hub — полный цикл разработки в одном инструменте.
Оставить комментарий