Slide 48
Slide 48 text
48 © 2023 LayerX Inc.
問題を分割してみる
入力から出力までを意味のある単位で分割し多段の処理で表現、よりうまく機械学習で解けない
か、あるいは機械学習という手段を取らない方が良い処理がないか検討してみる。
請求書ファイル
(画像・PDF)
支払期日
支払金額 500,000
請求書に記載の
項目ごとの値
実際の運用に即した値
{
“bbox”: [{"x": 0.3421,
"y": 0.567},...],
"word": “2021/2/28”
},...
2021/02/28
株式会社テンプレ
取引先
支払期日
支払金額 448,950
2021/02/26
株式会社テンプレ
取引先
請求書内の
文字と座標
たとえば、
● 請求書ファイルから文字検出と文字認識を行う処理と、それぞれの文字がどの項目に該当するか推定する処理
を加えることで、「請求書内の文字と座標」という中間出力を追加
● 「請求書に記載の値」を「実際の運用に即した値」に変換する処理を加えることで、それぞれを分割
項目推定
なんらかの
変換処理
文字検出
文字認識