articleHuggingFace Blog
Community Evals: Because we're done trusting black-box leaderboards over the community
Hugging Face lance des évaluations décentralisées et transparentes via les communautés pour combler le fossé entre scores de benchmarks et performance réelle. Les modèles publient leurs résultats dans .eval_results/ et les benchmarks affichent des classeurs dynamiques, avec vérification par badges et contributions via pull requests. Cela expose l’historique et les sources afin que la communauté puisse discuter et reproduire les évaluations.
publié 04 FÉVR. 2026★★★★★
Lire la sourcehuggingface.co/blog/community-evals
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
- Source
- HuggingFace Blog
- Ingéré
- 04 FÉVR. 2026 · 19:10
- Score édito
- 5.0 / 5