articleHuggingFace Blog
SmolVLM2: Bringing Video Understanding to Every Device
SmolVLM2 rend la compréhension vidéo accessible sur tous les devices via trois tailles (2.2B, 500M et 256M) et des APIs MLX dès le départ. Par rapport à la génération précédente, il optimise la mémoire et excelle sur Video-MME, avec des démos et une interface interactive pour tester la vision et la compréhension vidéo même dans un Colab gratuit.
published FEB 20, 2025★★★★★
Read the sourcehuggingface.co/blog/smolvlm2
[*] Opens in a new tab · no tracking on Lantern's side
- Source
- HuggingFace Blog
- Ingested
- FEB 20, 2025 · 19:10
- Editorial score
- 4.0 / 5