Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款に対する派生文書の矛盾認識
Search
自然言語処理研究室
March 31, 2010
Research
0
120
保険約款に対する派生文書の矛盾認識
丹治 広樹, 山本 和英. 保険約款に対する派生文書の矛盾認識. 言語処理学会第16回年次大会, pp.820-823 (2010.3)
自然言語処理研究室
March 31, 2010
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
330
データサイエンス13_解析.pdf
jnlp
0
380
データサイエンス12_分類.pdf
jnlp
0
290
データサイエンス11_前処理.pdf
jnlp
0
400
Recurrent neural network based language model
jnlp
0
100
自然言語処理研究室 研究概要(2012年)
jnlp
0
100
自然言語処理研究室 研究概要(2013年)
jnlp
0
69
自然言語処理研究室 研究概要(2014年)
jnlp
0
64
自然言語処理研究室 研究概要(2015年)
jnlp
0
120
Other Decks in Research
See All in Research
メタ動画データセットによる動作認識の現状と可能性
yuyay
0
170
My Journey as a UX Researcher
aranciap
0
1.1k
20240209 データを肴に熊本の交通を考える会「車1割削減、渋滞半減、公共交通2倍」をめざし世界に学ぼう
trafficbrain
0
770
Cross-Media Information Spaces and Architectures
signer
PRO
0
120
説明可能AI:代表的手法と最近の動向
yuyay
1
580
クロスモーダル表現学習の研究動向: 音声関連を中心として
ryomasumura
3
570
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
130
Accurate Method and Variable Tracking in Commit History
tsantalis
0
240
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations
rudorudo11
0
160
一般化ランダムフォレストの理論と統計的因果推論への応用
tomoshige_n
10
1.8k
CSC590 Lecture 01
javiergs
PRO
0
130
訓練データ作成のためのCloudCompareを利用した点群の手動ラベリング
kentaitakura
0
510
Featured
See All Featured
Web Components: a chance to create the future
zenorocha
305
41k
Robots, Beer and Maslow
schacon
PRO
155
7.9k
Why Our Code Smells
bkeepers
PRO
331
56k
How to Ace a Technical Interview
jacobian
272
22k
4 Signs Your Business is Dying
shpigford
175
21k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
273
13k
Imperfection Machines: The Place of Print at Facebook
scottboms
258
12k
The Cult of Friendly URLs
andyhume
74
5.7k
RailsConf 2023
tenderlove
2
530
Fireside Chat
paigeccino
20
2.6k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
115
18k
Optimizing for Happiness
mojombo
370
69k
Transcript
保険約款に対する 派生文書の矛盾認識 長岡技術科学大学 丹治 広樹 山本 和英
2 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集
マニュアル 印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2
3 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集 マニュアル 印刷約款 契約概要
etc. 背景 金融庁 保険会社 流用 社員・代理店 契約者 申請 認可 人手による 校正が困難 2 数万ページ
4 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 3
5 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 書類間の矛盾を網羅しながら 人手で見るべき文書量を削減する 3
6 基礎書類 保険契約の内容・条件・種類を定めたもの 国に許可を得るため法律文のような傾向がある 章・条・項等の箇条書きで構成されている 括弧書きによる注釈を含む
約款 保険の主契約に付随するオプション 約款と同様の体裁をとる 特約(特別約款) etc. 4
7 派生文書 保険の保障範囲、保険金が支払われない場合 等についてまとめたもの 客に理解を促すため図表や敬語を使用している 契約概要 免責事項や個人情報等について書かれたもの
契約概要と同様の体裁をとる 注意喚起情報 5
8 6 本研究における矛盾 数値の間違い 否定表現の間違い 使用している語の不統一 事故の日から180日以内に~
⇔ 事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 etc. + 契約者ご自身 ⇔ 契約者本人
9 手法 1. 派生文書特有の単語を辞書に登録 2. 基準を用いて矛盾を含む文を認識 Li et al.の”False Entailment
Recognition”を 参考に基準を作成 商品 本書 別紙 下表 etc. 7 • Number Mismatch • Time & Date Mismatch • Location Mismatch • Quantifier Mismatch • “Say” relation mismatch • “Locate” relation mismatch • Negation and subjunctive mismatch
10 使用した基準 数値の不一致 派生文書に出現した数値が基礎書類に存在しない 時間や日付の不一致 派生文書に出現した日付や時間が基礎書類に存在しない
単語の不一致 派生文書に出現した単語が基礎書類に存在しない 「すべて/いずれか」の不一致 派生文書に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない 否定表現の不一致 派生文書に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 8
11 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9
12 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9 再現率0.85で 文書量を半分以下に削減できた
13 矛盾認識できた例 基礎書類にそろえるべき表現 基礎書類と一致しない数値 極性が一意な場合の否定表現 ケガ(傷害) ご自身(本人)
クーリング・オフ etc. 188日(180日) 88%( ) etc. 委託先に取扱いを委託しない場合 etc. 10
14 認識できなかった例 極性が定まっていない否定表現 保険料をお支払いしない場合 etc. 周辺文脈や共起語を用いて場面と極性を特定 11
15 誤って認識した例 具体例等を含んだ文 国内や海外旅行中に足を骨折した。 スカイダイビング、ハンググライダー搭乗等、 etc. 基礎書類との関連度を計算して具体例を除外 12
16 今後の課題 1. 周辺文脈等を用いた再現率の向上 2. より多くの派生文書を用いた実験 3. 具体例の除去等による適合率の向上 13
17 まとめ 人手による校正を支援するために、基礎書類と 派生文書の間に生じた矛盾を認識した 5つの基準を用いた手法により、再現率0.85で 文書量を半分以下に削減できた 書類の増量および再現率の向上を目指す
14
18 発表は以上です ご清聴ありがとうございました