[⋯]Loading

Built solo in Lille, FR·v0.6

Dev & AI feed

The best of dev and AI, scored every day by an agent. Filtered, summarized, ranked. No color, no noise — just the substance.

Issue: No. 141
Date: MAY 21, 2026
Edition: EN · DAILY
Sources: 14 active
Articles: 42 today

§ Feed·Vol. 02·No. 141

Last ingest·08:00 UTC+0·Next·08:00

Filters

Reference PanelA.1

01. Type— 5

02. Period— 3

03. Source— 7

04. Score— min.

0 active

$⌘K

Articles / day42

7-day avg.42

Mon → Sun-62%

Feed · 851 articles

sort byscore·DESC ↓

501MAR 3115:10

articleHuggingFace Blog·2 mo. ago

Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents

Granite 4.0 3B Vision is a compact vision-language model built for enterprise document understanding, combining language and vision in a modular design. It introduces ChartNet, a large multimodal chart dataset, and DeepStack architecture for layered visual feature injection to improve table, chart, and key-value extraction. The model ships as a LoRA adapter, enabling text-only fallbacks and integration with Docling.

★★★★★·HuggingFace Blog

502MAR 3108:23

articleHuggingFace Blog·2 mo. ago

Training mRNA Language Models Across 25 Species for $165

L’article décrit la construction d’un pipeline open‑source de bout en bout pour l’optimisation des codons mRNA, de la prédiction de structure à la conception de séquences. Après avoir comparé différents modèles de langage, le CodonRoBERTa‑large‑v2 surpasse largement ModernBERT en perplexité et corrélation CAI. Il déploie enfin un système conditionné par espèce, entrainé sur 25 organismes en 55 GPU‑heures.

★★★★★·HuggingFace Blog

503MAR 3100:00

articleHuggingFace Blog·2 mo. ago

TRL v1.0: Post-Training Library Built to Move with the Field

TRL v1.0 formalizes a post-training library matured from research code into production-grade infrastructure, now supporting over 75 methods. The release embraces a shifting field where objectives and architectures evolve rapidly, and prioritizes stable, adaptable design so methods remain usable in practice.

★★★★★·HuggingFace Blog

504MAR 2700:00

articleHuggingFace Blog·2 mo. ago

Liberate your OpenClaw

L’article explique comment rétablir un agent OpenClave après restriction d’accès aux modèles fermés : passer par Hugging Face Inference Providers ou installer un modèle open source en local avec llama.cpp. Il détaille les commandes, la configuration et les choix matériels, en proposant des modèles comme GLM-5 et Qwen3.5.

★★★★★·HuggingFace Blog

505MAR 2402:01

articleHuggingFace Blog·2 mo. ago

A New Framework for Evaluating Voice Agents (EVA)

L'article présente EVA, un nouveau cadre d'évaluation conçu pour juger les agents vocaux conversationnels en intégrant simultanément l'exactitude de la tâche (EVA-A) et l'expérience utilisateur (EVA-X) sur des dialogues multi-tours réalistes. Il fournit un benchmark initial avec un dataset aéroportier de 50 scénarios et analyse vingt systèmes, révélant un compromis systématique entre précision et expérience. EVA est accompagné de données, de code et d'outils publiés.

★★★★★·HuggingFace Blog

506MAR 2019:38

articleHuggingFace Blog·2 mo. ago

Build a Domain-Specific Embedding Model in Under a Day

L’article présente une méthode pour affiner en moins d’un jour un modèle d’embeddings sur un domaine cible sans étiquettes manuelles. En exploitant un générateur de données synthétiques piloté par LLM et un apprentissage contrastif avec mining de hard negatives, on améliore significativement la qualité des embeddings et donc des pipelines RAG.

★★★★★·HuggingFace Blog

507MAR 1716:37

articleHuggingFace Blog·2 mo. ago

State of Open Source on Hugging Face: Spring 2026

Open source AI activity on Hugging Face grew rapidly in 2025, with users, models, and datasets roughly doubling. The platform reached about 13M users, more than 2M public models, and over 500k public datasets, with a rise in derivative artifacts like fine-tuned models and adapters. The ecosystem remains highly concentrated, and distribution across regions and domains shows clear frontrunners.

★★★★★·HuggingFace Blog

508MAR 1712:33

articleHuggingFace Blog·2 mo. ago

Holotron-12B - High Throughput Computer Use Agent

H Company annonce Holotron-12B, un modèle multimodal post-entraîné sur Nemotron-Nano-2 VL, optimisé pour les agents de prise en charge d’écran à haut débit. Son architecture hybride SSM/réseau de neurones réduit la consommation mémoire et permet un throughput significativement accru en inférence, notamment avec des contextes longs et plusieurs images. Il démontre de fortes améliorations sur les benchmarks d’agents par rapport au modèle de base Nemotron.

★★★★★·HuggingFace Blog

509MAR 1000:00

articleHuggingFace Blog·2 mo. ago

Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

L’article analyse comment la désagrégation de l’inférence et de l’entraînement via un buffer de rollouts et un sync asynchrone résout le goulot d’étranglement où les GPUs d’entraînement restent inactifs. Il passe en revue 16 librairies open-source à travers 7 axes (orchestration, buffer, poids, gestion de la péremption, partial rollout, LoRA, backend distribué).

★★★★★·HuggingFace Blog

510MAR 1000:00

toolHuggingFace Blog·2 mo. ago

Introducing Storage Buckets on the Hugging Face Hub

Les Storage Buckets sur le Hub Hugging Face offrent un stockage S3-like non versionné, optimisé pour les artefacts ML (checkpoints, états, données intermédiaires). Basés sur Xet, ils dédupliquent les chunks pour réduire bande passante et coûts, avec un warming préalable vers les régions compute. Installation et sync en CLI en moins de 2 minutes.

★★★★★·HuggingFace Blog

511MAR 0900:00

articleHuggingFace Blog·2 mo. ago

Ulysses Sequence Parallelism: Training with Million-Token Contexts

Ulysses Sequence Parallelism (SP) distribue le calcul de l'attention sur plusieurs GPU en fendant la séquence et les heads d'attention, permettant un entraînement avec des contextes de plusieurs millions de tokens. Chaque GPU traite un shard de séquence puis procède à des all-to-all pour échanger les clés/valeurs par sous-ensembles de heads. Cette approche du Snowflake AI Research intègre nativement Hugging Face (Accelerate, Transformers Trainer, TRL SFTTrainer).

★★★★★·HuggingFace Blog

512MAR 0900:00

articleHuggingFace Blog·2 mo. ago

LeRobot v0.5.0: Scaling Every Dimension

LeRobot v0.5.0 expands hardware with Unitree G1 humanoid full support, including whole-body control, manipulation, teleoperation. It adds new policies such as Pi0-FAST autoregressive VLAs and Real-Time Chunking for responsive inference, plus streaming video encoding to reduce wait times. It also introduces EnvHub, IsaacLab-Arena integration, and a modernized codebase on Python 3.12/Transformers v5.

★★★★★·HuggingFace Blog

513MAR 0514:16

articleHuggingFace Blog·3 mo. ago

Bringing Robotics AI to Embedded Platforms: Dataset Recording, VLA Fine‑Tuning, and On‑Device Optimizations

The article discusses deploying Vision–Language–Action (VLA) models on embedded robots, emphasizing that end‑to‑end latency and asynchronous inference are key to smooth motion. It also shares practical best practices for recording reliable robotic datasets (fixed cameras, lighting, contrast) and argues for a gripper‑mounted camera to improve manipulation accuracy, detailing how these choices enable real‑time on‑device optimization on the i.MX 95.

★★★★★·HuggingFace Blog

514MAR 0500:00

articleHuggingFace Blog·3 mo. ago

Introducing Modular Diffusers - Composable Building Blocks for Diffusion Pipelines

Modular Diffusers introduit des blocs réutilisables pour composer des workflows de diffusion flexibles, sans avoir à réécrire toute la pipeline. Cela permet de mélanger, inspecter et exécuter indépendamment des blocs comme encodage texte, VAE et dénoisage, avec un exemple d’intégration avec Mellon via une interface node-based. L’API reste familière mais la structure interne devient modulaire et extensible.

★★★★★·HuggingFace Blog

515MAR 0316:50

articleHuggingFace Blog·3 mo. ago

PRX Part 3 — Training a Text-to-Image Model in 24h!

L’article décrit une expérience de training intensif en 24h d’un modèle de texte-vers-image en combinant x-prediction (prédiction directe en pixel), un contrôle de token par patch, et des pertes perceptuelles (LPIPS et DINOv2). Il montre comment booster la convergence et la qualité sous un budget compute serré, et open-source le code pour reproduire le protocole.

★★★★★·HuggingFace Blog

516FEB 2600:00

articleHuggingFace Blog·3 mo. ago

Mixture of Experts (MoEs) in Transformers

L’article explique comment les Mixture of Experts (MoEs) dans les Transformers remplacent certaines couches densées par des experts partiels sélectionnés par un routeur, réduisant ainsi les coûts d’inférence et de déploiement. MoEs améliorent le rapport compute/performance et permettent une parallélisation par experts, comme en témoignent les récents modèles open (gpt-oss, Qwen 3.5, DeepSeek R1).

★★★★★·HuggingFace Blog

517FEB 2000:00

articleHuggingFace Blog·3 mo. ago

GGML and llama.cpp join HF to ensure the long-term progress of Local AI

GGML, creators of llama.cpp, are joining Hugging Face to secure the long-term progress of Local AI. The team retains full autonomy while HF provides sustainable resources, with a goal of near-seamless model deployment from transformers and improved packaging/UX to make llama.cpp ubiquitous on devices.

★★★★★·HuggingFace Blog

518FEB 2000:00

articleHuggingFace Blog·3 mo. ago

Train AI models with Unsloth and Hugging Face Jobs for FREE

L’article montre comment utiliser Unsloth avec Hugging Face Jobs pour fine‑tuner gratuitement des petits LLM (ex. LFM2.5-1.2B-Instruct) en bénéficiant d’un entraînement ~2x plus rapide et avec ~60% de VRAM en moins. Il fournit CLI et exemples de scripts, ainsi que l’intégration via des agents codants (Claude Code, Codex) pour automatiser le training et le push vers le Hub.

★★★★★·HuggingFace Blog

519FEB 1816:15

articleHuggingFace Blog·3 mo. ago

IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST

IBM and UC Berkeley use ITBench and MAST to diagnose why enterprise agentic LLMs fail in IT automation (incident triage, logs/metrics, Kubernetes). They show that benchmark success rates hide root causes, with frontier models failing in isolated verification bottlenecks and large open models cascading via early reasoning mismatches. The work proposes concrete agent design patterns to harden reliability.

★★★★★·HuggingFace Blog

520FEB 1800:00

articleHuggingFace Blog·3 mo. ago

One-Shot Any Web App with Gradio's gr.HTML

L'article présente gr.HTML de Gradio 6, qui supporte désormais templates personnalisés, CSS scoping et interactivité JavaScript, permettant de construire n’importe quel composant web en un seul fichier Python. Cela permet à un LLM de générer frontend, backend et gestion d’état en une seule passe, sans build, et le tout est déployable sur Hugging Face Spaces en quelques secondes.

★★★★★·HuggingFace Blog

Page 26 / 43

← Prev.Next →

20 of 851 shown

Issue 141 · Digest

The weekly digest, every Sunday.

20 articles ranked by an agent. No noise, no ads. One-click unsubscribe.

Subscribe →

[top 7 days]B.1

01.
Chasing down why installing the kernel segfaulted
Lobsters
02.
I turned a $80 RK3562 Android tablet into a Debian Linux workstation
Hacker News (100+ pts)
03.
Mullvad exit IPs as a fingerprinting vector
Lobsters
04.
Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality
HuggingFace Blog
05.
int a = 5; a = a++ + ++a; a = ? (2011)
Lobsters

Colophon · MakerC.1

Quentin Lecocq · @celdama

Fullstack dev · CRO freelance · Lille, FR

Lantern is a side-project — aggregation, AI scoring, weekly digest. Built with Next.js 16, Drizzle, Neon & Claude. One maintainer.

[X][GitHub][RSS][Site]

ShortcutsC.2

Search⌘ K
Next articleJ
Previous articleK
OpenEnter
FavoriteF

Dev & AI feed

§Feed · 851 articles

Feed · 851 articles