CodeT5
CodeT5 — семейство предварительно обученных encoder-decoder моделей для задач на программном коде: от суммаризации и перевода NL↔PL до генерации и исправления кода. Модель вводит «identifier-aware» пре-трейнинг, лучше учитывая семантику имён и контекст.
Линейка CodeT5+ улучшает архитектуру и обучение, давая прирост на HumanEval и других бенчмарках. Доступны готовые веса на Hugging Face и исходники от Salesforce для дообучения и интеграции в пайплайны разработки/исследований.
- Поддержка ключевых задач: суммаризация, генерация, перевод кода.
- Identifier-aware пре-трейнинг для работы с именами и семантикой.
- CodeT5+: масштабирование и instruction-tuning для более сложных задач.
- Открытые веса/чекпойнты и репозиторий с примерами.
- Интеграция через Hugging Face и экосистемные библиотеки.
Источники:
Записей не найдено.