articleHuggingFace Blog

AprielGuard: A Guardrail for Safety and Adversarial Robustness in Modern LLM Systems

AprielGuard est un modèle de sécurité 8B conçu pour détecter 16 catégories de risques et une large gamme d'attaques adverses dans les flux multi-tours et les workflows agentiques. Il opère sur prompts uniques, conversations et traces d’agents, avec un mode explicable et un mode basse latence. Sa taxinomie unifie sécurité et robustesse adversarial, formée sur un corpus synthétique.

publié 23 DÉC. 2025★★★★★

Lire la sourcehuggingface.co/blog/ServiceNow-AI/aprielguard

[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern

Source: HuggingFace Blog
Ingéré: 23 DÉC. 2025 · 19:10
Score édito: 5.0 / 5