Slide 4
Slide 4 text
言語間転移学習の実際(mBERT)
● 知識は言語に依存したパラメータと言語を横断したパラメータの双方で表現されている
● 言語を横断して知識を獲得する場合もあるが、性能は言語によって大きくバラツキがある
4
mBERTのmLAMAデータセットでの言語ごとの正解数と訓練コーパス中に該当する知識が含まれている割合
Unraveling Cross-Lingual Dynamics in Language Models: Independent, Shared and Transferred Factual Knowledge (Zhao et al., EACL 2024)