articleHuggingFace Blog
Nemotron-Personas-Japan: ソブリン AI のための合成データセット
Nemotron-Personas-Japan は、日本の公的統計に沿った合成ペルソナデータセットで、総計600万件の日本語ペルソナを含みます。データは CC BY 4.0 で公開され、NeMo Data Designer を用いた合成データ生成パイプラインと複数の生成バックエンドで、日本語AIのファインチューニングやソブリンAI開発を支援します。個人を特定できる情報は含まず、教育・職業・地域・文化背景などの統計属性を自然言語で表現します。
publié 26 SEPT. 2025★★★★★
Lire la sourcehuggingface.co/blog/nvidia/nemotron-personas-japan-ja
[*] Ouvre dans un nouvel onglet · pas de tracking côté Lantern
- Source
- HuggingFace Blog
- Ingéré
- 26 SEPT. 2025 · 19:10
- Score édito
- 4.0 / 5