Slide 39
Slide 39 text
コーパス利用に関するポリシー
39
● コーパス リリースレベル
○ LLM-jpが収集したコーパス(サブセット単位)
に対して定められるデータ公開ルール
○ リリースレベルに基づいてデータの利用法を決定
リリースレベル 用途
L1: train, search, distribute 制限なし
L2: train, search 再頒布の禁止
L3: train 軽微利用も含めて再公開の禁止
LX: no-train 公開予定モデルでの学習禁止
LZ: no-use あらゆる派生物の公開禁止
Actual
release
levels
Only subsets
with L1,L2,L3
levels are used
to train LLM-jp
models