Slide 4
Slide 4 text
矩形自体+そのまわりの情報
Transformer/GNNなど NN 系
● 自然に扱えるため初手から性能が出ている人がお
おい印象
LightGBM など GradientBoostedDecisionTree 系
● 単に矩形+集約情報では弱い
● 同じ名刺の別の矩形への予測値を集約するなど
1-stage の予測値の集約をして初めてNNと同等
の性能になる
● 同一名刺内に同じラベルが存在しないことを捉え
にくい?
● 初手LightGBMだと苦労が多かったかも?
Label=X
Label=X
Label=X
Label=X
こっちもX
これもX?
ナイーブなラベル出力の例. 4つの矩形が同じラベ
ルに割り当てられている、が本当?
他の矩形情報を取りこむ等工夫がないと、似た座標
にある矩形が同じラベルになりやすい。
きみもX??