Slide 31
Slide 31 text
© LayerX Inc.
⽂書から⾦額を抽出したいと考えた場合
識別モデルと⽣成モデルの違い
● 事前定義されたラベルを元の⽂字列に付与していく
● 事前定義したラベル以外の出⼒をすることがない
ため、コントローラブル
● 元の⽂字列を改変することはない
● 逆に事前定義したもの以外は出⼒できない
● 事前定義された語彙の中から
抽出したいフォーマットに合わせて出⼒
● 推論時に定義するとあらゆるラベルを抽出できる
● 正しいフォーマットで出⼒できるかも
精度に影響してくる
● 元の⽂字列が改変される可能性がある
totalAmount
“...合計⾦額(税込) ¥12,000 請求書 発⾏⽇ ...“
other
other
“...合計⾦額(税込) ¥12,000 請求書 発⾏⽇ ...“
{
“totalAmount”: {
“rawText”: “¥12,000”,
“processedValue”: 12,000,
}
…
}
出⼒空間
識別モデル ⽣成モデル
1
2
3
4
1
2
3
4