FeedThis weekArticle
articleHuggingFace Blog

SmolVLM2: Bringing Video Understanding to Every Device

SmolVLM2 rend la compréhension vidéo accessible sur tous les devices via trois tailles (2.2B, 500M et 256M) et des APIs MLX dès le départ. Par rapport à la génération précédente, il optimise la mémoire et excelle sur Video-MME, avec des démos et une interface interactive pour tester la vision et la compréhension vidéo même dans un Colab gratuit.

published FEB 20, 2025★★★★
Read the sourcehuggingface.co/blog/smolvlm2
[*] Opens in a new tab · no tracking on Lantern's side
Source
HuggingFace Blog
Ingested
FEB 20, 2025 · 19:10
Editorial score
4.0 / 5