FeedThis weekArticle
articleHuggingFace Blog

Falcon Perception

Falcon Perception est un Transformer early-fusion à 0,6B paramètres pour la perception open-vocabulary guidée par du texte, mélangeant images et tokens textuels dans une seule séquence. Il utilise un masquage hybride et Chain-of-Perception pour prédire coordonnées, tailles et masques de manière structurée et évolutive. Les benchmarks montrent de meilleures performances que SAM 3, avec un écart restant sur le calibration de la présence.

published APR 01, 2026★★★★★
Read the sourcehuggingface.co/blog/tiiuae/falcon-perception
[*] Opens in a new tab · no tracking on Lantern's side
Source
HuggingFace Blog
Ingested
APR 01, 2026 · 19:10
Editorial score
3.0 / 5