articleHuggingFace Blog

Smol2Operator: Post-Training GUI Agents for Computer Use

L’article présente Smol2Operator, une méthode de post-entraînement qui donne à un VLM léger (SmolVLM2-2.2B-Instruct) des capacités de compréhension et d’interaction avec les interfaces graphiques. En deux phases — d’abord l’ancrage perçu, puis la cognition/agenticité — les auteurs transforment des données hétérogènes en un espace d’actions unifié et open source. Ils libèrent modèles, données, outils et recettes pour reproduire et étendre la recherche.

publié 23 SEPT. 2025★★★★★

Lire la sourcehuggingface.co/blog/smol2operator

[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern

Source: HuggingFace Blog
Ingéré: 23 SEPT. 2025 · 19:10
Score édito: 4.0 / 5