articleHuggingFace Blog
Granite 4.1 LLMs: How They’re Built
Granite 4.1 est une famille de LLMs dense, décodeur uniquement (3B/8B/30B) entraînés sur ~15T tokens avec une fenêtre allant jusqu’à 512K, via un pipeline de pré-entraînement en cinq phases et un apprentissage par RL (GRPO/DAPO). L’article détaille l’architecture (GQA, RoPE, SwiGLU, RMSNorm, embeddings partagés) et une stratégie de données axée sur la qualité, incluant un supervisé finetuning (~4.1M échantillons) et une longue formation au contexte.
publié 29 AVR. 2026★★★★★
Lire la sourcehuggingface.co/blog/ibm-granite/granite-4-1
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
- Source
- HuggingFace Blog
- Ingéré
- 29 AVR. 2026 · 04:08
- Score édito
- 4.0 / 5