Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公的文書に対する「やさしい日本語」換言辞書作成のための調査
Search
自然言語処理研究室
March 31, 2011
Research
100
0
Share
公的文書に対する「やさしい日本語」換言辞書作成のための調査
杢 真奈見, 山本 和英. 公的文書に対する「やさしい日本語」換言辞書作成のための調査. 言語処理学会第17回年次大会, pp.376-379 (2011.3)
自然言語処理研究室
March 31, 2011
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
410
データサイエンス13_解析.pdf
jnlp
0
530
データサイエンス12_分類.pdf
jnlp
0
370
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
160
自然言語処理研究室 研究概要(2012年)
jnlp
0
160
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
230
Other Decks in Research
See All in Research
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
kogo
0
460
非試合日の野球場を楽しむためのARホームランボールキャッチ体験システムの開発 / EC79-miyazaki
yumulab
0
150
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
320
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
220
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.6k
多様なデータを許容し学習し続ける模倣学習 / Advanced Imitation Learning for VLA
prinlab
0
150
Dwangoでの漫画データ活用〜漫画理解と動画作成〜@コミック工学シンポジウム2025
kzmssk
0
230
Data Visualization Tools in the Age of AI
flekschas
0
120
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
190
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
1.2k
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
1.4k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
500
Featured
See All Featured
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
240
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
How GitHub (no longer) Works
holman
316
150k
Tell your own story through comics
letsgokoyo
1
900
Paper Plane (Part 1)
katiecoart
PRO
0
6.8k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Design in an AI World
tapps
1
200
Building Adaptive Systems
keathley
44
3k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
140
How to build a perfect <img>
jonoalderson
1
5.4k
Mind Mapping
helmedeiros
PRO
1
170
Transcript
公的文書に対する 「やさしい日本語」換言辞書 作成のための調査 長岡技術科学大学 電気系 杢 真奈見 山本 和英 1
研究背景 2 現在、日本には十分な日本語能力を 持たない外国人が数十万人いる。 現支援策 … 多言語での情報提供 ⇒ 全情報を多言語化することは 難しく、時間・コスト的に負担 支援策として最善ではない
研究背景 3 日本語母語話者(日本人) 文法、語彙に制限をかけて日本語 から「やさしい日本語」へ換言 日本語初学者(外国人) 最低限の文法と語彙を習得 「やさしい日本語」
「やさしい日本語」 4 対象者:日本語初学者 →留学生や外国人労働者等の 日本語能力の低い人々 「やさしい」と難しいの定義 →最低限の文法、語彙を習得した
日本語初学者の判断 (使用コーパス:日本語教師の主観による判断)
既存研究 5 本研究と同じコーパスを用いて 統計的機械翻訳 (松田ら・2010) ⇒ 変換の精度が低かった ➔原因:コーパスのフォーマット・質が 機械翻訳に適していない 人手による「やさしい日本語」 換言辞書の有効性を調査
研究目的
コーパス 6 公的文書を日本語教師が3段階の 「やさしい日本語」に訳したもの ➢逐語訳 難しい表現 ⇒ 「やさしい」表現 (逐語的に訳したもの) ➢意訳 文意等を損なわないように可能な限り
「やさしい日本語」に換言 ➢要約 可能な限り文を簡約化
辞書の作成方法 7 原文と逐語訳を使用 コーパス例) 原文 …世界的に新型(豚)インフルエンザ の流行が危惧されています。
逐語訳…世界中で新型インフルエンザ の流行が心配されています。 「世界的に」が「世界中で」に換言…等
換言辞書の内容(1/3) 8 換言例) 単語: 接種 ⇒ 注射 複合名詞:
任意接種 ⇒ 任意の注射 年号: 平成21年 ⇒ 2009年 補助動詞: お読みいただき ⇒ 読んで 敬語等: たまわりまして ⇒ いただき
換言辞書の内容(2/3) 9 換言例) 省略: ~等、~を対象、各~ 補完: (月) ⇒
(月曜日) (カッコ)の情報: 新型(豚)インフルエンザ ⇒ 新型インフルエンザ 低学年(3年生まで) ⇒ 3年生まで
換言辞書の内容(3/3) 10 逐語的ではない換言例) 助成措置が講じられておりますので ⇒ 少し安くなりますから 保護者の皆様のご理解とご協力を ⇒ 皆さん、どうか理解と協力を お願いします。
評価実験 11 換言辞書の内容から20文の評価データを 作成し、評価のための小規模実験を行った。 ➢被験者:留学生2名 ➢評価方法:4種類 ①元の文の方がやさしく感じる ②換言後の方がやさしく感じる
③どちらもやさしく感じる ④どちらも難しく感じる
評価実験 12 評価データ例) 換言前:平成22年8月16日(月)~20日(金) に市立病院にて予防接種を行います。 換言後:2010年8月16日(月曜日)~20日(金曜日) に市立病院で予防注射を行います。 ⇒ 結果:換言後がやさしいと判断 …平均15.5文
/ 20文
考察 13 複合名詞の分割 予定人数→ 予定の人数 必要書類→ 必要な書類
地区住民→ 地区に住んでいる人 敬語…尊敬語・謙譲語 ⇒ これらを解消することで やさしくなった。
結論 14 人手で作成した換言辞書の評価 →20文中15.5文がやさしいと判断 ⇒辞書の有効性が確認できた。 複合名詞と敬語の問題を解消すると 日本語はやさしくなり、日本語初学者 の理解を助ける。
今後の課題 15 換言辞書の完成 換言辞書を用いた換言システムの作成