[⋯]Chargement

Built solo in Lille, FR·v0.6

Veille dev & IA

Le meilleur du dev et de l'IA, scoré chaque jour par un agent. Filtré, résumé, classé. Aucune couleur, aucun bruit — juste la matière.

Issue: No. 153
Date: 02 JUIN 2026
Édition: FR · DAILY
Sources: 14 actives
Articles: 29 aujourd'hui

§ Feed·Vol. 02·No. 153

Last ingest·10:00 UTC+2·Next·08:00

Filtres

Reference PanelA.1

01. Type— 5

02. Période— 3

03. Source— 7

04. Score— min.

0 actifs

$⌘K

Articles / jour29

7-jour moy.18

Lun → Dim

Feed · 879 articles

trier parscore·DESC ↓

56127 JANV01:53

articleHuggingFace Blog·il y a 4 m.

Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective

Agentic reinforcement learning trains LLMs over multi-step interactions with an environment, optimizing on-policy data as the agent plans, uses tools, and refines its decisions. The post presents Verl as an OSS framework, experiments with GPT-OSS-20B (and 120B) and benchmarks like Qwen-2.5-32B, and uses ReTool to verify tool-assisted coding tasks. It also covers integrating Harmony's chat template and the end-to-end loop from rollout collection to policy updates (GRPO or PPO).

★★★★★·HuggingFace Blog

56221 JANV06:25

articleHuggingFace Blog·il y a 4 m.

AssetOpsBench: Bridging the Gap Between AI Agent Benchmarks and Industrial Reality

AssetOpsBench est un benchmark d’évaluation des agents IA conçu pour l’industrie, couvrant la gestion du cycle de vie des actifs via 2,3 M de points de capteurs, 140 scénarios et 53 modes de défaillance. Il évalue la coordination multi-agents sur six dimensions qualitatives et analyse les trajectoires d’échec via TrajFM. Les agents généraux peinent sur les dépendances temporelles et l’intégration des ordres de travail.

★★★★★·HuggingFace Blog

56320 JANV15:02

articleHuggingFace Blog·il y a 4 m.

One Year Since the “DeepSeek Moment”

L’article retrace un an après le « DeepSeek Moment », où le modèle R1 a catalysé l’écosystème open source chinois, abaissant les barrières techniques et légales. Il montre comment DeepSeek R1 est devenu une référence mondiale, encourageant l’adoption de modèles open et redéfinissant les compromis coût/performance. Cette dynamé s’inscrit dans une réorganisation stratégique de l’IA en Chine et chez ses partenaires.

★★★★★·HuggingFace Blog

56420 JANV03:20

articleHuggingFace Blog·il y a 4 m.

Differential Transformer V2

L'article présente Differential Transformer V2, une variante d'attention qui double les heads de requête tout en conservant le nombre de heads clé/valeur, permettant des décodages plus rapides sans kernel personnalisé. Le mécanisme différentiel combine les résultats de deux projections d'attention avec un paramètre λ par tête, simplifié par une contrainte de magnitude Softmax. Les auteurs démontrent par ablation et benchmarks des gains de débit et une compatibilité avec FlashAttention.

★★★★★·HuggingFace Blog

56520 JANV00:00

articleHuggingFace Blog·il y a 4 m.

Introducing Waypoint-1: Real-time interactive video diffusion from Overworld

Waypoint-1 is Overworld’s real-time interactive video diffusion model, controllable by mouse and keyboard with low latency. It’s trained via diffusion forcing on 10k hours of game footage and runs through the WorldEngine inference library for streaming frames in real time. The article covers training details, self-forcing, and optimizations that enable ~30 FPS on consumer hardware.

★★★★★·HuggingFace Blog

56615 JANV00:00

articleHuggingFace Blog·il y a 5 m.

Open Responses: What you need to know

Open Responses est une norme d’inférence ouverte initiée par OpenAI et soutenue par Hugging Face, visant à remplacer le format Chat Completion pour les agents autonomes. Le standard formalise l’affichage des traces de raisonnement (content, encrypted_content, summary) et le streaming sémantique, et fournit une API compatible avec les routeurs pour les clients et les providers.

★★★★★·HuggingFace Blog

56705 JANV22:56

articleHuggingFace Blog·il y a 5 m.

NVIDIA Cosmos Reason 2 Brings Advanced Reasoning To Physical AI

Cosmos Reason 2 is an open reasoning vision-language model for physical AI, with improved spatio-temporal understanding, 256K context, and edge-to-cloud deployment options. It adds OCR, 2D/3D localization, and trajectory reasoning, achieving top benchmarks and offering Cosmos Cookbook patterns for video analytics, AV captioning, and robot planning.

★★★★★·HuggingFace Blog

56805 JANV09:16

articleHuggingFace Blog·il y a 5 m.

Introducing Falcon-H1-Arabic: Pushing the Boundaries of Arabic Language AI with Hybrid Architecture

Falcon-H1-Arabic introduit une architecture hybride Mamba-Transformer parallèle, repoussant les limites du traitement du langage arabe (128K–256K tokens). Les modèles 3B, 7B et 34B dépassent les SOTA de leur catégorie et ciblent analyse de longs documents, assistants de production et usages enterprise.

★★★★★·HuggingFace Blog

56905 JANV00:00

articleHuggingFace Blog·il y a 5 m.

NVIDIA brings agents to life with DGX Spark and Reachy Mini

L’article montre comment utiliser le DGX Spark et Reachy Mini pour donner des capacités d’agent autonome (raisonnement, vision, parole) en suivant 5 étapes : setup, interface chat, ReAct avec NeMo Agent Toolkit, routage de modèles, et synthèse vocale en temps réel, le tout open source et pilotable en simulation ou sur robot réel.

★★★★★·HuggingFace Blog

57023 DÉC14:07

articleHuggingFace Blog·il y a 5 m.

AprielGuard: A Guardrail for Safety and Adversarial Robustness in Modern LLM Systems

AprielGuard est un modèle de sécurité 8B conçu pour détecter 16 catégories de risques et une large gamme d'attaques adverses dans les flux multi-tours et les workflows agentiques. Il opère sur prompts uniques, conversations et traces d’agents, avec un mode explicable et un mode basse latence. Sa taxinomie unifie sécurité et robustesse adversarial, formée sur un corpus synthétique.

★★★★★·HuggingFace Blog

57118 DÉC00:00

articleHuggingFace Blog·il y a 6 m.

Tokenization in Transformers v5: Simpler, Clearer, and More Modular

L’article détaille la refonte des tokenizers dans Transformers v5 : séparation de l’architecture du tokenizer et du vocabulaire entraîné, pipeline de tokenisation modulaire (normalizer, pre-tokenizer, modèle, post-processor), et utilisation simplifiée via AutoTokenizer. Cela permet d’inspecter, personnaliser et entraîner des tokenizers avec beaucoup moins de friction, en s’appuyant sur un backend rapide en Rust.

★★★★★·HuggingFace Blog

57217 DÉC13:22

articleHuggingFace Blog·il y a 6 m.

The Open Evaluation Standard: Benchmarking NVIDIA Nemotron 3 Nano with NeMo Evaluator

L’article présente la recette d’évaluation open source de NVIDIA pour le modèle Nemotron 3 Nano 30B A3B, construite avec NeMo Evaluator. Elle vise à garantir la reproductibilité et la transparence des benchmarks, en publiant prompts, configs, artefacts et logs pour permettre aux développeurs de vérifier et de comparer les modèles de façon fiable.

★★★★★·HuggingFace Blog

57315 DÉC16:01

agentHuggingFace Blog·il y a 6 m.

CUGA on Hugging Face: Democratizing Configurable AI Agents

CUGA (Configurable Generalist Agent) is an open-source, configurable AI agent designed for complex, multi-step web and API tasks, combining planner–executor patterns with structured planning to reduce hallucinations. Integrated into Hugging Face Spaces, it offers a visual, low-code workflow via Langflow and emphasizes fast inference for enterprise use.

★★★★★·HuggingFace Blog

57411 DÉC15:47

articleHuggingFace Blog·il y a 6 m.

New in llama.cpp: Model Management

The llama.cpp server now ships a router mode that can load, unload, and switch between multiple models without a restart. It runs models in separate processes, offers auto-discovery of GGUF models, on-demand loading, and LRU eviction (default 4). API endpoints and a web UI let you load/unload models and switch contexts, enabling simple A/B testing and multi-tenant deployments.

★★★★★·HuggingFace Blog

57511 DÉC00:00

articleHuggingFace Blog·il y a 6 m.

Codex is Open Sourcing AI models

L’article présente l’open‑sourcing des modèles Codex, qui permet à un agent de codage (Claude Code, Codex, Gemini CLI) d’utiliser les Hugging Face Skills pour des expérimentations ML complètes : fine‑tuning, suivi d’entraînement, évaluation, rapports, conversion GGUF et publication sur le Hub. Cela étend la démarche de « Claude Code to train open source models » à Codex en mode end‑to‑end, avec prise en charge des méthodes de production (SFT, DPO, RL).

★★★★★·HuggingFace Blog

57605 DÉC00:00

articleHuggingFace Blog·il y a 6 m.

Introducing swift-huggingface: The Complete Swift Client for Hugging Face

Swift-huggingface is a ground-up Swift client for the Hugging Face Hub, addressing slow, unreliable downloads and fragmented authentication with a Python-compatible cache, resumable file operations, and a TokenProvider pattern. It offers complete Hub API coverage, OAuth support for user-facing apps, and a roadmap toward a deduplicating Xet backend, with example Swift integrations for tokens and sign-in.

★★★★★·HuggingFace Blog

57704 DÉC00:00

articleHuggingFace Blog·il y a 6 m.

DeepMath: A lightweight math reasoning Agent with smolagents

DeepMath est un agent de raisonnement mathématique léger basé sur Qwen3-4B Thinking, affiné avec GRPO pour préférer des traces courtes et axées sur le code. Il exécute des snippets Python dans un bac à sable, réduit drastiquement la longueur des réponses et améliore la précision. L’approche est mise en œuvre via smolagents et évaluée sur MATH500, AIME, HMMT et HLE.

★★★★★·HuggingFace Blog

57804 DÉC00:00

toolHuggingFace Blog·il y a 6 m.

We Got Claude to Fine-Tune an Open Source LLM

L’article présente une skill Hugging Face qui permet à Claude Code de piloter des fins d’entraînement (SFT, DPO, GRPO) sur GPU cloud, valider les jeux de données, suivre les jobs, convertir en GGUF et déployer des modèles open‑source de 0,5B à 70B. L’idée est de déléguer la configuration matérielle, les scripts d’entraînement et le monitoring à l’agent, pour déclencher une exécution reproductible en quelques commandes.

★★★★★·HuggingFace Blog

57901 DÉC00:00

articleHuggingFace Blog·il y a 6 m.

Transformers v5: Simple model definitions powering the AI ecosystem

Transformers v5 focuses on simplicity, a modular design, and expanded model definitions to accelerate training, inference, and production. It introduces architectural abstractions like AttentionInterface and broader model additions, aiming for a cleaner, more interoperable ecosystem.

★★★★★·HuggingFace Blog

58025 NOV00:00

articleHuggingFace Blog·il y a 6 m.

Continuous batching from first principles

The post derives continuous batching from first principles of attention and KV caching to maximize throughput for multi-user LLM serving. It explains how Q, K, V are computed and how their interaction yields quadratic complexity, then shows how continuous batching processes multiple conversations in parallel, swapping them as they complete. The goal is to make real-time AI chat more scalable under high load.

★★★★★·HuggingFace Blog

Page 29 / 44

← Préc.Suiv. →

20 sur 879 affichés

Issue 153 · Digest

Le résumé hebdo, livré dimanche.

20 articles classés par un agent. Aucun bruit, aucune pub. Désabonnement en un clic.

S'abonner →

[top 7 jours]B.1

01.
thunderbolt-ibverbs: We have InfiniBand at home
Lobsters
02.
Beyond LLMs: Why Scalable Enterprise AI Adoption Depends on Agent Logic
HuggingFace Blog
03.
Five Years of Trying to Add Recursion to lychee
Lobsters
04.
ELF Linker Improvements in Zig
Lobsters
05.
UTF8 email with DMA: DragonFly Mail Agent
Lobsters

Colophon · MakerC.1

Quentin Lecocq · @celdama

Dev fullstack · CRO freelance · Lille, FR

Lantern est un side-project — agrégation, scoring IA, digest hebdo. Construit avec Next.js 16, Drizzle, Neon & Claude. Un seul mainteneur.

[X][GitHub][RSS][Site]

RaccourcisC.2

Recherche⌘ K
Article suivantJ
Article précédentK
OuvrirEnter
FavoriF

Veille dev & IA

§Feed · 879 articles

Feed · 879 articles