FeedCette semaineArticle
articleHuggingFace Blog

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

Nemotron 3 Nano Omni est un modèle omni-modal conçu pour l’analyse de documents longs, le raisonnement sur images et l’audio-vidéo. Il affiche des scores de référence sur OCRBenchV2, MMLongBench-Doc, WorldSense et DailyOmni, et propose des gains d’efficacité et de débit par rapport aux modèles open-weight concurrents.

publié 28 AVR. 2026★★★★
Lire la sourcehuggingface.co/blog/nvidia/nemotron-3-nano-omni-multimodal-intelligence
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
Source
HuggingFace Blog
Ingéré
28 AVR. 2026 · 19:35
Score édito
4.0 / 5