Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
保険関連文書を対象とした校正支援システム
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
自然言語処理研究室
March 31, 2012
Research
74
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
保険関連文書を対象とした校正支援システム
大平真一, 山本和英. 保険関連文書を対象とした校正支援システム. 言語処理学会第18回年次大会, pp.243-246 (2012.3)
自然言語処理研究室
March 31, 2012
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
500
Recurrent neural network based language model
jnlp
0
170
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
150
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
R&Dチームを起ち上げる
shibuiwilliam
1
260
SoftMatcha 2: 1兆語規模コーパスの超高速かつ柔らかい検索
e869120_sub
6
3.4k
Cross-Media Information Spaces and Architectures
signer
PRO
0
300
老舗ものづくり企業でリサーチが変革を起こすまで - 三菱重工DXの実践
skydats
0
180
多様なデータを許容し学習し続ける模倣学習 / Advanced Imitation Learning for VLA
prinlab
0
210
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
160
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
610
第12回人と環境にやさしい交通をめざす全国大会/熊本都市圏「車1割削減、渋滞半減、公共交通2倍」をめざして
trafficbrain
0
110
FUSE-RSVLM: Feature Fusion Vision-Language Model for Remote Sensing
satai
3
840
NLP colloquium: AI Safety Survey
kanekomasahiro
0
540
東京大学工学部計数工学科、計数工学特別講義の説明資料
kikuzo
0
460
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
210
Featured
See All Featured
Technical Leadership for Architectural Decision Making
baasie
3
400
Exploring anti-patterns in Rails
aemeredith
3
400
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
How to train your dragon (web standard)
notwaldorf
97
6.7k
BBQ
matthewcrist
89
10k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
840
Faster Mobile Websites
deanohume
310
31k
Visualization
eitanlees
152
17k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
390
Making the Leap to Tech Lead
cromwellryan
135
9.9k
HDC tutorial
michielstock
2
690
Transcript
保険関連文書を 対象とした 校正支援システム 長岡技術科学大学 電気系 大平 真一,山本 和英
研究背景 ① 保険分野におけるDTPの増加 校正の手法は従来通り人手 一文字ずつのチェックを複数人で行う 契約書類であるため誤りが許されない
精度の維持とコストの低下が求められる
保険関連文書 ② 基礎書類 契約内容の詳細を記載した書類 • 普通約款 • 特別約款
派生書類 消費者への説明に用いられる書類 • パンフレット • 説明書
基礎書類・派生書類 ③ 基礎書類 法律文に近い文体 章・条・項などの構造が厳密 図や表は補助的に使用
派生書類 簡単な語や表現の使用 図や表を中心とした構成
ガイドライン ④ 送り仮名や常用外漢字の扱い 保険関連文書の読みにくさの分析 1文中での同音単語の使用 複雑な文章構造
• 二重否定や入り組んだ括弧書きなど 難解な用語 • 保険や医療に関する専門用語など
標準約款 基礎書類 派生書類 重要事項 説明書 特別約款 事業方法書 規定集 パンフレット etc.
保険会社 ガイドライン 各種保険協会 遵守 要約 金融庁 申請 認可 消費者 配布
人手による校正 内容についての矛盾の解消 内容のチェック 基礎書類との対応付け 語の誤り訂正
変換誤り ガイドラインの遵守 ⑤
⑥ 誤り分析 表記ゆれ(ガイドラインに起因) 送り仮名 かなと漢字の混在 変換誤り
同音異字 専門用語 その他 数字・記号の誤挿入など
校正支援システム 文類似度 計算 校正者 校正対象文 ガイドライン 類似文 基礎書類 派生書類 入力
誤り訂正
自動対応付け ⑦ 内容語の一致率を用いた類似度計算 Simpson係数とJaccard係数がベース 頻度による重み付け (低頻度=重み大)
1 1 2 1 2 1 , min ) ( 1 ) ( 1 ) , ( F F w freq F F w freq S S sim
• 入力文「…業務上の災害を保証する…」 • 類似文「…災害を補償する他の災害補償制度…」 • 出力文「…業務上の災害を補償する…」 誤り検出 ⑧ 変換ミスが対象
辞書化したガイドラインのチェック 類似文中での同音単語の使われ方を確認 例
今後の課題 ⑨ 組版ソフトへの組み込み 校正以外への利用場面の検討 類似文抽出に用いる素性の検討
保険分野以外の用途 基礎・派生書類に類似した関係の文書 金融や医薬品に関する文書 独自のガイドラインを持つ文書 社内向けの文書など