Custom Kernels for All from Codex and Claude
L’article présente un agent skill qui permet aux modèles de codage (Claude, Codex) de générer des kernels CUDA optimisés pour des cibles précises (diffusers, transformers). Il fournit connaissances d’architecture, modèles de mémoire, intégration PyTorch et benchmarks, du packaging jusqu’au déploiement. Le skill est distribué via une librairie et s’installe en une commande.