Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険関連文書を対象とした校正支援システム
Search
自然言語処理研究室
March 31, 2012
Research
1
70
保険関連文書を対象とした校正支援システム
大平真一, 山本和英. 保険関連文書を対象とした校正支援システム. 言語処理学会第18回年次大会, pp.243-246 (2012.3)
自然言語処理研究室
March 31, 2012
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
510
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
480
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
生成AIとうまく付き合うためのプロンプトエンジニアリング
yuri_ohashi
0
130
湯村研究室の紹介2025 / yumulab2025
yumulab
0
300
超高速データサイエンス
matsui_528
2
370
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
3
470
音声感情認識技術の進展と展望
nagase
0
460
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
200
CoRL2025速報
rpc
4
4.1k
OWASP KansaiDAY 2025.09_文系OSINTハンズオン
owaspkansai
0
110
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
120
LiDARセキュリティ最前線(2025年)
kentaroy47
0
110
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
360
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
540
Featured
See All Featured
Amusing Abliteration
ianozsvald
0
95
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
320
Darren the Foodie - Storyboard
khoart
PRO
2
2.3k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
WCS-LA-2024
lcolladotor
0
440
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.9k
A better future with KSS
kneath
240
18k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
660
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.8k
How GitHub (no longer) Works
holman
316
140k
Transcript
保険関連文書を 対象とした 校正支援システム 長岡技術科学大学 電気系 大平 真一,山本 和英
研究背景 ① 保険分野におけるDTPの増加 校正の手法は従来通り人手 一文字ずつのチェックを複数人で行う 契約書類であるため誤りが許されない
精度の維持とコストの低下が求められる
保険関連文書 ② 基礎書類 契約内容の詳細を記載した書類 • 普通約款 • 特別約款
派生書類 消費者への説明に用いられる書類 • パンフレット • 説明書
基礎書類・派生書類 ③ 基礎書類 法律文に近い文体 章・条・項などの構造が厳密 図や表は補助的に使用
派生書類 簡単な語や表現の使用 図や表を中心とした構成
ガイドライン ④ 送り仮名や常用外漢字の扱い 保険関連文書の読みにくさの分析 1文中での同音単語の使用 複雑な文章構造
• 二重否定や入り組んだ括弧書きなど 難解な用語 • 保険や医療に関する専門用語など
標準約款 基礎書類 派生書類 重要事項 説明書 特別約款 事業方法書 規定集 パンフレット etc.
保険会社 ガイドライン 各種保険協会 遵守 要約 金融庁 申請 認可 消費者 配布
人手による校正 内容についての矛盾の解消 内容のチェック 基礎書類との対応付け 語の誤り訂正
変換誤り ガイドラインの遵守 ⑤
⑥ 誤り分析 表記ゆれ(ガイドラインに起因) 送り仮名 かなと漢字の混在 変換誤り
同音異字 専門用語 その他 数字・記号の誤挿入など
校正支援システム 文類似度 計算 校正者 校正対象文 ガイドライン 類似文 基礎書類 派生書類 入力
誤り訂正
自動対応付け ⑦ 内容語の一致率を用いた類似度計算 Simpson係数とJaccard係数がベース 頻度による重み付け (低頻度=重み大)
1 1 2 1 2 1 , min ) ( 1 ) ( 1 ) , ( F F w freq F F w freq S S sim
• 入力文「…業務上の災害を保証する…」 • 類似文「…災害を補償する他の災害補償制度…」 • 出力文「…業務上の災害を補償する…」 誤り検出 ⑧ 変換ミスが対象
辞書化したガイドラインのチェック 類似文中での同音単語の使われ方を確認 例
今後の課題 ⑨ 組版ソフトへの組み込み 校正以外への利用場面の検討 類似文抽出に用いる素性の検討
保険分野以外の用途 基礎・派生書類に類似した関係の文書 金融や医薬品に関する文書 独自のガイドラインを持つ文書 社内向けの文書など