Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents
Nemotron 3 Nano Omni est un modèle omni-modal conçu pour l’analyse de documents longs, le raisonnement sur images et l’audio-vidéo. Il affiche des scores de référence sur OCRBenchV2, MMLongBench-Doc, WorldSense et DailyOmni, et propose des gains d’efficacité et de débit par rapport aux modèles open-weight concurrents.