Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険関連文書を対象とした校正支援システム
Search
自然言語処理研究室
March 31, 2012
Research
1
65
保険関連文書を対象とした校正支援システム
大平真一, 山本和英. 保険関連文書を対象とした校正支援システム. 言語処理学会第18回年次大会, pp.243-246 (2012.3)
自然言語処理研究室
March 31, 2012
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
470
データサイエンス12_分類.pdf
jnlp
0
330
データサイエンス11_前処理.pdf
jnlp
0
450
Recurrent neural network based language model
jnlp
0
130
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
93
自然言語処理研究室 研究概要(2014年)
jnlp
0
110
自然言語処理研究室 研究概要(2015年)
jnlp
0
180
Other Decks in Research
See All in Research
A multimodal data fusion model for accurate and interpretable urban land use mapping with uncertainty analysis
satai
3
220
Collaborative Development of Foundation Models at Japanese Academia
odashi
2
560
最適化と機械学習による問題解決
mickey_kubo
0
140
言語モデルの内部機序:解析と解釈
eumesy
PRO
48
18k
線形判別分析のPU学習による朝日歌壇短歌の分析
masakat0
0
130
Combinatorial Search with Generators
kei18
0
310
LLM-as-a-Judge: 文章をLLMで評価する@教育機関DXシンポ
k141303
3
810
言語モデルによるAI創薬の進展 / Advancements in AI-Driven Drug Discovery Using Language Models
tsurubee
2
370
SSII2025 [TS3] 医工連携における画像情報学研究
ssii
PRO
2
1.1k
公立高校入試等に対する受入保留アルゴリズム(DA)導入の提言
shunyanoda
0
5.7k
心理言語学の視点から再考する言語モデルの学習過程
chemical_tree
2
340
SSII2025 [TS2] リモートセンシング画像処理の最前線
ssii
PRO
7
2.8k
Featured
See All Featured
The Cult of Friendly URLs
andyhume
79
6.5k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Unsuck your backbone
ammeep
671
58k
Why You Should Never Use an ORM
jnunemaker
PRO
57
9.4k
Designing for humans not robots
tammielis
253
25k
GitHub's CSS Performance
jonrohan
1031
460k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Building Applications with DynamoDB
mza
95
6.5k
Typedesign – Prime Four
hannesfritz
42
2.7k
Into the Great Unknown - MozCon
thekraken
39
1.9k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Transcript
保険関連文書を 対象とした 校正支援システム 長岡技術科学大学 電気系 大平 真一,山本 和英
研究背景 ① 保険分野におけるDTPの増加 校正の手法は従来通り人手 一文字ずつのチェックを複数人で行う 契約書類であるため誤りが許されない
精度の維持とコストの低下が求められる
保険関連文書 ② 基礎書類 契約内容の詳細を記載した書類 • 普通約款 • 特別約款
派生書類 消費者への説明に用いられる書類 • パンフレット • 説明書
基礎書類・派生書類 ③ 基礎書類 法律文に近い文体 章・条・項などの構造が厳密 図や表は補助的に使用
派生書類 簡単な語や表現の使用 図や表を中心とした構成
ガイドライン ④ 送り仮名や常用外漢字の扱い 保険関連文書の読みにくさの分析 1文中での同音単語の使用 複雑な文章構造
• 二重否定や入り組んだ括弧書きなど 難解な用語 • 保険や医療に関する専門用語など
標準約款 基礎書類 派生書類 重要事項 説明書 特別約款 事業方法書 規定集 パンフレット etc.
保険会社 ガイドライン 各種保険協会 遵守 要約 金融庁 申請 認可 消費者 配布
人手による校正 内容についての矛盾の解消 内容のチェック 基礎書類との対応付け 語の誤り訂正
変換誤り ガイドラインの遵守 ⑤
⑥ 誤り分析 表記ゆれ(ガイドラインに起因) 送り仮名 かなと漢字の混在 変換誤り
同音異字 専門用語 その他 数字・記号の誤挿入など
校正支援システム 文類似度 計算 校正者 校正対象文 ガイドライン 類似文 基礎書類 派生書類 入力
誤り訂正
自動対応付け ⑦ 内容語の一致率を用いた類似度計算 Simpson係数とJaccard係数がベース 頻度による重み付け (低頻度=重み大)
1 1 2 1 2 1 , min ) ( 1 ) ( 1 ) , ( F F w freq F F w freq S S sim
• 入力文「…業務上の災害を保証する…」 • 類似文「…災害を補償する他の災害補償制度…」 • 出力文「…業務上の災害を補償する…」 誤り検出 ⑧ 変換ミスが対象
辞書化したガイドラインのチェック 類似文中での同音単語の使われ方を確認 例
今後の課題 ⑨ 組版ソフトへの組み込み 校正以外への利用場面の検討 類似文抽出に用いる素性の検討
保険分野以外の用途 基礎・派生書類に類似した関係の文書 金融や医薬品に関する文書 独自のガイドラインを持つ文書 社内向けの文書など