articleHuggingFace Blog
Granite 4.1 LLMs: How They’re Built
Granite 4.1 est une famille de LLMs dense, décodeur uniquement (3B/8B/30B) entraînés sur ~15T tokens avec une fenêtre allant jusqu’à 512K, via un pipeline de pré-entraînement en cinq phases et un apprentissage par RL (GRPO/DAPO). L’article détaille l’architecture (GQA, RoPE, SwiGLU, RMSNorm, embeddings partagés) et une stratégie de données axée sur la qualité, incluant un supervisé finetuning (~4.1M échantillons) et une longue formation au contexte.
published APR 29, 2026★★★★★
Read the sourcehuggingface.co/blog/ibm-granite/granite-4-1
[*] Opens in a new tab · no tracking on Lantern's side
- Source
- HuggingFace Blog
- Ingested
- APR 29, 2026 · 04:08
- Editorial score
- 4.0 / 5