Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款に対する派生文書の矛盾認識
Search
自然言語処理研究室
March 31, 2010
Research
0
180
保険約款に対する派生文書の矛盾認識
丹治 広樹, 山本 和英. 保険約款に対する派生文書の矛盾認識. 言語処理学会第16回年次大会, pp.820-823 (2010.3)
自然言語処理研究室
March 31, 2010
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
470
データサイエンス12_分類.pdf
jnlp
0
330
データサイエンス11_前処理.pdf
jnlp
0
450
Recurrent neural network based language model
jnlp
0
130
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
93
自然言語処理研究室 研究概要(2014年)
jnlp
0
110
自然言語処理研究室 研究概要(2015年)
jnlp
0
180
Other Decks in Research
See All in Research
ASSADS:ASMR動画に合わせて撫でられる感覚を提示するシステムの開発と評価 / ec75-shimizu
yumulab
1
380
作業記憶の発達的特性が言語獲得の臨界期を形成する(NLP2025)
chemical_tree
2
610
利用シーンを意識した推薦システム〜SpotifyとAmazonの事例から〜
kuri8ive
1
200
学生向けアンケート<データサイエンティストについて>
datascientistsociety
PRO
0
3.1k
Looking for Escorts in Sydney?
lunsophia
1
120
20250605_新交通システム推進議連_熊本都市圏「車1割削減、渋滞半減、公共交通2倍」から考える地方都市交通政策
trafficbrain
0
440
業界横断 副業・兼業者の実態調査
fkske
0
160
90 分で学ぶ P 対 NP 問題
e869120
17
7.5k
SSII2025 [SS1] レンズレスカメラ
ssii
PRO
2
960
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
510
Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery
satai
3
480
実行環境に中立なWebAssemblyライブマイグレーション機構/techtalk-2025spring
chikuwait
0
220
Featured
See All Featured
Rails Girls Zürich Keynote
gr2m
94
14k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Mobile First: as difficult as doing things right
swwweet
223
9.7k
Visualization
eitanlees
146
16k
Build The Right Thing And Hit Your Dates
maggiecrowley
36
2.8k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
How to Ace a Technical Interview
jacobian
277
23k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
48
2.9k
Done Done
chrislema
184
16k
Transcript
保険約款に対する 派生文書の矛盾認識 長岡技術科学大学 丹治 広樹 山本 和英
2 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集
マニュアル 印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2
3 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集 マニュアル 印刷約款 契約概要
etc. 背景 金融庁 保険会社 流用 社員・代理店 契約者 申請 認可 人手による 校正が困難 2 数万ページ
4 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 3
5 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 書類間の矛盾を網羅しながら 人手で見るべき文書量を削減する 3
6 基礎書類 保険契約の内容・条件・種類を定めたもの 国に許可を得るため法律文のような傾向がある 章・条・項等の箇条書きで構成されている 括弧書きによる注釈を含む
約款 保険の主契約に付随するオプション 約款と同様の体裁をとる 特約(特別約款) etc. 4
7 派生文書 保険の保障範囲、保険金が支払われない場合 等についてまとめたもの 客に理解を促すため図表や敬語を使用している 契約概要 免責事項や個人情報等について書かれたもの
契約概要と同様の体裁をとる 注意喚起情報 5
8 6 本研究における矛盾 数値の間違い 否定表現の間違い 使用している語の不統一 事故の日から180日以内に~
⇔ 事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 etc. + 契約者ご自身 ⇔ 契約者本人
9 手法 1. 派生文書特有の単語を辞書に登録 2. 基準を用いて矛盾を含む文を認識 Li et al.の”False Entailment
Recognition”を 参考に基準を作成 商品 本書 別紙 下表 etc. 7 • Number Mismatch • Time & Date Mismatch • Location Mismatch • Quantifier Mismatch • “Say” relation mismatch • “Locate” relation mismatch • Negation and subjunctive mismatch
10 使用した基準 数値の不一致 派生文書に出現した数値が基礎書類に存在しない 時間や日付の不一致 派生文書に出現した日付や時間が基礎書類に存在しない
単語の不一致 派生文書に出現した単語が基礎書類に存在しない 「すべて/いずれか」の不一致 派生文書に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない 否定表現の不一致 派生文書に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 8
11 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9
12 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9 再現率0.85で 文書量を半分以下に削減できた
13 矛盾認識できた例 基礎書類にそろえるべき表現 基礎書類と一致しない数値 極性が一意な場合の否定表現 ケガ(傷害) ご自身(本人)
クーリング・オフ etc. 188日(180日) 88%( ) etc. 委託先に取扱いを委託しない場合 etc. 10
14 認識できなかった例 極性が定まっていない否定表現 保険料をお支払いしない場合 etc. 周辺文脈や共起語を用いて場面と極性を特定 11
15 誤って認識した例 具体例等を含んだ文 国内や海外旅行中に足を骨折した。 スカイダイビング、ハンググライダー搭乗等、 etc. 基礎書類との関連度を計算して具体例を除外 12
16 今後の課題 1. 周辺文脈等を用いた再現率の向上 2. より多くの派生文書を用いた実験 3. 具体例の除去等による適合率の向上 13
17 まとめ 人手による校正を支援するために、基礎書類と 派生文書の間に生じた矛盾を認識した 5つの基準を用いた手法により、再現率0.85で 文書量を半分以下に削減できた 書類の増量および再現率の向上を目指す
14
18 発表は以上です ご清聴ありがとうございました