We Got Claude to Fine-Tune an Open Source LLM
L’article présente une skill Hugging Face qui permet à Claude Code de piloter des fins d’entraînement (SFT, DPO, GRPO) sur GPU cloud, valider les jeux de données, suivre les jobs, convertir en GGUF et déployer des modèles open‑source de 0,5B à 70B. L’idée est de déléguer la configuration matérielle, les scripts d’entraînement et le monitoring à l’agent, pour déclencher une exécution reproductible en quelques commandes.