articleHuggingFace Blog
Alyah ⭐: Toward Robust Evaluation of Emirati Dialect Capabilities in Arabic LLMs
L'article présente Alyah, un benchmark emirati conçu pour évaluer les capacités des LLM arabes sur les dialectes locaux, bien au-delà du MSA classique. Il détaille la construction manuelle de 1 173 échantillons, les catégories culturelles couvertes et la structure d'évaluation, mettant en lumière les limites des benchmarks existants.
publié 27 JANV. 2026★★★★★
Lire la sourcehuggingface.co/blog/tiiuae/emirati-benchmarks
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
- Source
- HuggingFace Blog
- Ingéré
- 27 JANV. 2026 · 19:10
- Score édito
- 4.0 / 5