Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険関連文書を対象とした校正支援システム
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
自然言語処理研究室
March 31, 2012
Research
1
71
保険関連文書を対象とした校正支援システム
大平真一, 山本和英. 保険関連文書を対象とした校正支援システム. 言語処理学会第18回年次大会, pp.243-246 (2012.3)
自然言語処理研究室
March 31, 2012
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
520
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
150
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
20251023_くまもと21の会例会_「車1割削減、渋滞半減、公共交通2倍」をめざして.pdf
trafficbrain
0
200
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
200
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
1.8k
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
200
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
170
COFFEE-Japan PROJECT Impact Report(海ノ向こうコーヒー)
ontheslope
0
980
R&Dチームを起ち上げる
shibuiwilliam
1
200
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
16
23k
その推薦システムの評価指標、ユーザーの感覚とズレてるかも
kuri8ive
1
340
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
130
LLM-Assisted Semantic Guidance for Sparsely Annotated Remote Sensing Object Detection
satai
3
600
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
510
Featured
See All Featured
Joys of Absence: A Defence of Solitary Play
codingconduct
1
310
Large-scale JavaScript Application Architecture
addyosmani
515
110k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
250
Code Reviewing Like a Champion
maltzj
528
40k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
390
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
190
Optimizing for Happiness
mojombo
378
71k
Navigating Weather and Climate Data
rabernat
0
140
WCS-LA-2024
lcolladotor
0
480
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
200
Building Adaptive Systems
keathley
44
3k
Transcript
保険関連文書を 対象とした 校正支援システム 長岡技術科学大学 電気系 大平 真一,山本 和英
研究背景 ① 保険分野におけるDTPの増加 校正の手法は従来通り人手 一文字ずつのチェックを複数人で行う 契約書類であるため誤りが許されない
精度の維持とコストの低下が求められる
保険関連文書 ② 基礎書類 契約内容の詳細を記載した書類 • 普通約款 • 特別約款
派生書類 消費者への説明に用いられる書類 • パンフレット • 説明書
基礎書類・派生書類 ③ 基礎書類 法律文に近い文体 章・条・項などの構造が厳密 図や表は補助的に使用
派生書類 簡単な語や表現の使用 図や表を中心とした構成
ガイドライン ④ 送り仮名や常用外漢字の扱い 保険関連文書の読みにくさの分析 1文中での同音単語の使用 複雑な文章構造
• 二重否定や入り組んだ括弧書きなど 難解な用語 • 保険や医療に関する専門用語など
標準約款 基礎書類 派生書類 重要事項 説明書 特別約款 事業方法書 規定集 パンフレット etc.
保険会社 ガイドライン 各種保険協会 遵守 要約 金融庁 申請 認可 消費者 配布
人手による校正 内容についての矛盾の解消 内容のチェック 基礎書類との対応付け 語の誤り訂正
変換誤り ガイドラインの遵守 ⑤
⑥ 誤り分析 表記ゆれ(ガイドラインに起因) 送り仮名 かなと漢字の混在 変換誤り
同音異字 専門用語 その他 数字・記号の誤挿入など
校正支援システム 文類似度 計算 校正者 校正対象文 ガイドライン 類似文 基礎書類 派生書類 入力
誤り訂正
自動対応付け ⑦ 内容語の一致率を用いた類似度計算 Simpson係数とJaccard係数がベース 頻度による重み付け (低頻度=重み大)
1 1 2 1 2 1 , min ) ( 1 ) ( 1 ) , ( F F w freq F F w freq S S sim
• 入力文「…業務上の災害を保証する…」 • 類似文「…災害を補償する他の災害補償制度…」 • 出力文「…業務上の災害を補償する…」 誤り検出 ⑧ 変換ミスが対象
辞書化したガイドラインのチェック 類似文中での同音単語の使われ方を確認 例
今後の課題 ⑨ 組版ソフトへの組み込み 校正以外への利用場面の検討 類似文抽出に用いる素性の検討
保険分野以外の用途 基礎・派生書類に類似した関係の文書 金融や医薬品に関する文書 独自のガイドラインを持つ文書 社内向けの文書など