Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険関連文書を対象とした校正支援システム
Search
自然言語処理研究室
March 31, 2012
Research
1
70
保険関連文書を対象とした校正支援システム
大平真一, 山本和英. 保険関連文書を対象とした校正支援システム. 言語処理学会第18回年次大会, pp.243-246 (2012.3)
自然言語処理研究室
March 31, 2012
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
510
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
Combining Deep Learning and Street View Imagery to Map Smallholder Crop Types
satai
3
580
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
15
20k
Community Driveプロジェクト(CDPJ)の中間報告
smartfukushilab1
0
170
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
120
姫路市 -都市OSの「再実装」-
hopin
0
1.6k
Ankylosing Spondylitis
ankh2054
0
120
生成AIとうまく付き合うためのプロンプトエンジニアリング
yuri_ohashi
0
140
音声感情認識技術の進展と展望
nagase
0
470
HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery
satai
3
630
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
540
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
240
J-RAGBench: 日本語RAGにおける Generator評価ベンチマークの構築
koki_itai
0
1.3k
Featured
See All Featured
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
117
110k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
99
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
400
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
79
From π to Pie charts
rasagy
0
130
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
190
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
200
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
SEO for Brand Visibility & Recognition
aleyda
0
4.2k
Site-Speed That Sticks
csswizardry
13
1.1k
Transcript
保険関連文書を 対象とした 校正支援システム 長岡技術科学大学 電気系 大平 真一,山本 和英
研究背景 ① 保険分野におけるDTPの増加 校正の手法は従来通り人手 一文字ずつのチェックを複数人で行う 契約書類であるため誤りが許されない
精度の維持とコストの低下が求められる
保険関連文書 ② 基礎書類 契約内容の詳細を記載した書類 • 普通約款 • 特別約款
派生書類 消費者への説明に用いられる書類 • パンフレット • 説明書
基礎書類・派生書類 ③ 基礎書類 法律文に近い文体 章・条・項などの構造が厳密 図や表は補助的に使用
派生書類 簡単な語や表現の使用 図や表を中心とした構成
ガイドライン ④ 送り仮名や常用外漢字の扱い 保険関連文書の読みにくさの分析 1文中での同音単語の使用 複雑な文章構造
• 二重否定や入り組んだ括弧書きなど 難解な用語 • 保険や医療に関する専門用語など
標準約款 基礎書類 派生書類 重要事項 説明書 特別約款 事業方法書 規定集 パンフレット etc.
保険会社 ガイドライン 各種保険協会 遵守 要約 金融庁 申請 認可 消費者 配布
人手による校正 内容についての矛盾の解消 内容のチェック 基礎書類との対応付け 語の誤り訂正
変換誤り ガイドラインの遵守 ⑤
⑥ 誤り分析 表記ゆれ(ガイドラインに起因) 送り仮名 かなと漢字の混在 変換誤り
同音異字 専門用語 その他 数字・記号の誤挿入など
校正支援システム 文類似度 計算 校正者 校正対象文 ガイドライン 類似文 基礎書類 派生書類 入力
誤り訂正
自動対応付け ⑦ 内容語の一致率を用いた類似度計算 Simpson係数とJaccard係数がベース 頻度による重み付け (低頻度=重み大)
1 1 2 1 2 1 , min ) ( 1 ) ( 1 ) , ( F F w freq F F w freq S S sim
• 入力文「…業務上の災害を保証する…」 • 類似文「…災害を補償する他の災害補償制度…」 • 出力文「…業務上の災害を補償する…」 誤り検出 ⑧ 変換ミスが対象
辞書化したガイドラインのチェック 類似文中での同音単語の使われ方を確認 例
今後の課題 ⑨ 組版ソフトへの組み込み 校正以外への利用場面の検討 類似文抽出に用いる素性の検討
保険分野以外の用途 基礎・派生書類に類似した関係の文書 金融や医薬品に関する文書 独自のガイドラインを持つ文書 社内向けの文書など