articleHuggingFace Blog
Falcon Perception
Falcon Perception est un Transformer early-fusion à 0,6B paramètres pour la perception open-vocabulary guidée par du texte, mélangeant images et tokens textuels dans une seule séquence. Il utilise un masquage hybride et Chain-of-Perception pour prédire coordonnées, tailles et masques de manière structurée et évolutive. Les benchmarks montrent de meilleures performances que SAM 3, avec un écart restant sur le calibration de la présence.
publié 01 AVR. 2026★★★★★
Lire la sourcehuggingface.co/blog/tiiuae/falcon-perception
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
- Source
- HuggingFace Blog
- Ingéré
- 01 AVR. 2026 · 19:10
- Score édito
- 3.0 / 5