FeedCette semaineArticle
articleHuggingFace Blog

DeepMath: A lightweight math reasoning Agent with smolagents

DeepMath est un agent de raisonnement mathématique léger basé sur Qwen3-4B Thinking, affiné avec GRPO pour préférer des traces courtes et axées sur le code. Il exécute des snippets Python dans un bac à sable, réduit drastiquement la longueur des réponses et améliore la précision. L’approche est mise en œuvre via smolagents et évaluée sur MATH500, AIME, HMMT et HLE.

publié 04 DÉC. 2025★★★★
Lire la sourcehuggingface.co/blog/intel-deepmath
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
Source
HuggingFace Blog
Ingéré
04 DÉC. 2025 · 19:10
Score édito
4.0 / 5