Slide 19
Slide 19 text
- CRFにおける系列全体のスコアは、トークンに対するラベル予測スコアとラベル間の遷移
スコアを考慮
- 問題点
- 特に⼯夫せず学習すると不正な遷移がしばしば残り、精度が低下
> “B-⼈名”, “I-組織名”, “I-⼈名”, … のようなケース
- 解決⽅法
- 不正な遷移には⼤きな負の値を初期値と
して与えることで、不正な遷移がなくなり
精度が向上
※ 署名抽出におけるCRFの場合も同等の処理を実施
CRF活⽤時の⼯夫: Masked CRF [Wei et al., 2021]
Start ╲End B-人名 I-人名 B-組織名 I-組織名 O
B-人名 0 0 0 -100 0
I-人名 0 0 0 -100 0
B-組織名 0 -100 0 0 0
I-組織名 0 -100 0 0 0
O 0 -100 0 -100 0
Tianwen Wei, Jianwei Qi, Shenghuan He, and Songtao Sun. 2021. Masked Conditional Random Fields for Sequence Labeling. In Proceedings of the
2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 2024–
2035, Online. Association for Computational Linguistics.
表: 初期値を設定したCRFの遷移⾏列の例