articleHuggingFace Blog
Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents
Nemotron 3 Nano Omni est un modèle omni-modal conçu pour l’analyse de documents longs, le raisonnement sur images et l’audio-vidéo. Il affiche des scores de référence sur OCRBenchV2, MMLongBench-Doc, WorldSense et DailyOmni, et propose des gains d’efficacité et de débit par rapport aux modèles open-weight concurrents.
publié 28 AVR. 2026★★★★★
Lire la sourcehuggingface.co/blog/nvidia/nemotron-3-nano-omni-multimodal-intelligence
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
- Source
- HuggingFace Blog
- Ingéré
- 28 AVR. 2026 · 19:35
- Score édito
- 4.0 / 5