Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険約款に対する派生文書の矛盾認識
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
自然言語処理研究室
March 31, 2010
Research
200
0
Share
保険約款に対する派生文書の矛盾認識
丹治 広樹, 山本 和英. 保険約款に対する派生文書の矛盾認識. 言語処理学会第16回年次大会, pp.820-823 (2010.3)
自然言語処理研究室
March 31, 2010
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
160
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
220
計算情報学研究室(数理情報学第7研究室)2026
tomohirokoana
0
230
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
160
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2.1k
[BlackHatAsia2026] Hidden Telemetry: Uncovering TraceLogging ETW Providers You're Not Using (Yet)
asuna_jp
1
350
それ、チームの改善になってますか?ー「チームとは?」から始めた組織の実験ー
hirakawa51
0
1.1k
2026年1月の生成AI領域の重要リリース&トピック解説
kajikent
0
980
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
320
台湾モデルに学ぶ詐欺広告対策:市民参加の必要性
dd2030
0
310
通時的な類似度行列に基づく単語の意味変化の分析
rudorudo11
0
260
はじまりの クエスチョンブック —余暇と豊かさにあふれた社会とは?
culturaltransition
PRO
0
380
An Open and Reproducible Deep Research Agent for Long-Form Question Answering
ikuyamada
0
420
Featured
See All Featured
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
170
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
1k
RailsConf 2023
tenderlove
30
1.4k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
1
200
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
Odyssey Design
rkendrick25
PRO
2
580
GraphQLとの向き合い方2022年版
quramy
50
15k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
200
Mobile First: as difficult as doing things right
swwweet
225
10k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
Transcript
保険約款に対する 派生文書の矛盾認識 長岡技術科学大学 丹治 広樹 山本 和英
2 背景 金融庁 保険会社 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集
マニュアル 印刷約款 契約概要 流用 社員・代理店 契約者 申請 認可 etc. 2
3 基礎書類 事業方法書 算出方法書 標準約款 派生文書 規定集 マニュアル 印刷約款 契約概要
etc. 背景 金融庁 保険会社 流用 社員・代理店 契約者 申請 認可 人手による 校正が困難 2 数万ページ
4 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 3
5 目的 基礎書類と矛盾する内容が 派生文書にあってはいけない 矛盾を自動で認識することにより 人手による校正を支援 書類間の矛盾を網羅しながら 人手で見るべき文書量を削減する 3
6 基礎書類 保険契約の内容・条件・種類を定めたもの 国に許可を得るため法律文のような傾向がある 章・条・項等の箇条書きで構成されている 括弧書きによる注釈を含む
約款 保険の主契約に付随するオプション 約款と同様の体裁をとる 特約(特別約款) etc. 4
7 派生文書 保険の保障範囲、保険金が支払われない場合 等についてまとめたもの 客に理解を促すため図表や敬語を使用している 契約概要 免責事項や個人情報等について書かれたもの
契約概要と同様の体裁をとる 注意喚起情報 5
8 6 本研究における矛盾 数値の間違い 否定表現の間違い 使用している語の不統一 事故の日から180日以内に~
⇔ 事故の日から188日以内に~ 以下に該当しない場合 ⇔ 以下に該当する場合 etc. + 契約者ご自身 ⇔ 契約者本人
9 手法 1. 派生文書特有の単語を辞書に登録 2. 基準を用いて矛盾を含む文を認識 Li et al.の”False Entailment
Recognition”を 参考に基準を作成 商品 本書 別紙 下表 etc. 7 • Number Mismatch • Time & Date Mismatch • Location Mismatch • Quantifier Mismatch • “Say” relation mismatch • “Locate” relation mismatch • Negation and subjunctive mismatch
10 使用した基準 数値の不一致 派生文書に出現した数値が基礎書類に存在しない 時間や日付の不一致 派生文書に出現した日付や時間が基礎書類に存在しない
単語の不一致 派生文書に出現した単語が基礎書類に存在しない 「すべて/いずれか」の不一致 派生文書に「すべて/いずれか」という表現が出現したとき、 同様の表現が基礎書類に存在しない 否定表現の不一致 派生文書に「~ない」等の否定表現が出現したとき、 同様の否定表現が基礎書類に存在しない 8
11 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9
12 実験 実験条件 基礎書類 (保険約款、特約) : 794文 派生文書 (契約概要、注意喚起情報)
: 224文 (うち矛盾を含む文 : 82文) 実験結果 再現率 適合率 圧縮率 0.85 0.69 0.46 (224→102) 9 再現率0.85で 文書量を半分以下に削減できた
13 矛盾認識できた例 基礎書類にそろえるべき表現 基礎書類と一致しない数値 極性が一意な場合の否定表現 ケガ(傷害) ご自身(本人)
クーリング・オフ etc. 188日(180日) 88%( ) etc. 委託先に取扱いを委託しない場合 etc. 10
14 認識できなかった例 極性が定まっていない否定表現 保険料をお支払いしない場合 etc. 周辺文脈や共起語を用いて場面と極性を特定 11
15 誤って認識した例 具体例等を含んだ文 国内や海外旅行中に足を骨折した。 スカイダイビング、ハンググライダー搭乗等、 etc. 基礎書類との関連度を計算して具体例を除外 12
16 今後の課題 1. 周辺文脈等を用いた再現率の向上 2. より多くの派生文書を用いた実験 3. 具体例の除去等による適合率の向上 13
17 まとめ 人手による校正を支援するために、基礎書類と 派生文書の間に生じた矛盾を認識した 5つの基準を用いた手法により、再現率0.85で 文書量を半分以下に削減できた 書類の増量および再現率の向上を目指す
14
18 発表は以上です ご清聴ありがとうございました