articleHuggingFace Blogground-truth · kubernetes
ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM
ITBench-AA évalue des tâches SRE IT d’entreprise via un cadre agentique; résultats frontier-models <50% et détails méthodologiques.
par Ayhan Sebin, Saurabh Jha, Rohan Arorapublié 27 MAI 2026★★★★★
Lire la sourcehuggingface.co/blog/ibm-research/itbench-aa
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
Extrait · ingestion Lantern
ITBench-AA évalue des tâches SRE IT d’entreprise via un cadre agentique; résultats frontier-models <50% et détails méthodologiques.
Extrait automatique · ~131 caractèresvoir la source complète →
- Source
- HuggingFace Blog
- Ingéré
- 27 MAI 2026 · 08:00
- Score édito
- 4.4 / 5