FeedThis weekArticle
articleHuggingFace Blog

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

Nemotron 3 Nano Omni est un modèle omni-modal conçu pour l’analyse de documents longs, le raisonnement sur images et l’audio-vidéo. Il affiche des scores de référence sur OCRBenchV2, MMLongBench-Doc, WorldSense et DailyOmni, et propose des gains d’efficacité et de débit par rapport aux modèles open-weight concurrents.

published APR 28, 2026★★★★
Source
HuggingFace Blog
Ingested
APR 28, 2026 · 19:35
Editorial score
4.0 / 5