Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents
Cet article présente EcomRLVE, extension du cadre RLVE pour des conversations e-commerce multi-tour avec outils et vérifiabilité des résultats. EcomRLVE-GYM offre 8 environnements vérifiables (découverte produit, substitution, panier, retours, suivi, policy QA, bundles, parcours multi-intents) avec génération procédurale et récompenses vérifiables.