articleHuggingFace Blog

SmolVLM2: Bringing Video Understanding to Every Device

SmolVLM2 rend la compréhension vidéo accessible sur tous les devices via trois tailles (2.2B, 500M et 256M) et des APIs MLX dès le départ. Par rapport à la génération précédente, il optimise la mémoire et excelle sur Video-MME, avec des démos et une interface interactive pour tester la vision et la compréhension vidéo même dans un Colab gratuit.

publié 20 FÉVR. 2025★★★★★

Lire la sourcehuggingface.co/blog/smolvlm2

[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern

Source: HuggingFace Blog
Ingéré: 20 FÉVR. 2025 · 19:10
Score édito: 4.0 / 5