Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公的文書に対する「やさしい日本語」換言辞書作成のための調査
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
自然言語処理研究室
March 31, 2011
Research
0
99
公的文書に対する「やさしい日本語」換言辞書作成のための調査
杢 真奈見, 山本 和英. 公的文書に対する「やさしい日本語」換言辞書作成のための調査. 言語処理学会第17回年次大会, pp.376-379 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
520
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
490
Recurrent neural network based language model
jnlp
0
150
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
120
自然言語処理研究室 研究概要(2014年)
jnlp
0
140
自然言語処理研究室 研究概要(2015年)
jnlp
0
220
Other Decks in Research
See All in Research
【NICOGRAPH2025】Photographic Conviviality: ボディペイント・ワークショップによる 同時的かつ共生的な写真体験
toremolo72
0
190
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
960
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.5k
CyberAgent AI Lab研修 / Social Implementation Anti-Patterns in AI Lab
chck
6
4k
討議:RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
0
560
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
730
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
570
その推薦システムの評価指標、ユーザーの感覚とズレてるかも
kuri8ive
1
340
2026-01-30-MandSL-textbook-jp-cos-lod
yegusa
1
620
姫路市 -都市OSの「再実装」-
hopin
0
1.7k
明日から使える!研究効率化ツール入門
matsui_528
7
1.6k
台湾モデルに学ぶ詐欺広告対策:市民参加の必要性
dd2030
0
180
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Navigating Team Friction
lara
192
16k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
The untapped power of vector embeddings
frankvandijk
2
1.6k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Ethics towards AI in product and experience design
skipperchong
2
220
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Build your cross-platform service in a week with App Engine
jlugia
234
18k
SEO for Brand Visibility & Recognition
aleyda
0
4.3k
Designing for Timeless Needs
cassininazir
0
160
How GitHub (no longer) Works
holman
316
140k
Transcript
公的文書に対する 「やさしい日本語」換言辞書 作成のための調査 長岡技術科学大学 電気系 杢 真奈見 山本 和英 1
研究背景 2 現在、日本には十分な日本語能力を 持たない外国人が数十万人いる。 現支援策 … 多言語での情報提供 ⇒ 全情報を多言語化することは 難しく、時間・コスト的に負担 支援策として最善ではない
研究背景 3 日本語母語話者(日本人) 文法、語彙に制限をかけて日本語 から「やさしい日本語」へ換言 日本語初学者(外国人) 最低限の文法と語彙を習得 「やさしい日本語」
「やさしい日本語」 4 対象者:日本語初学者 →留学生や外国人労働者等の 日本語能力の低い人々 「やさしい」と難しいの定義 →最低限の文法、語彙を習得した
日本語初学者の判断 (使用コーパス:日本語教師の主観による判断)
既存研究 5 本研究と同じコーパスを用いて 統計的機械翻訳 (松田ら・2010) ⇒ 変換の精度が低かった ➔原因:コーパスのフォーマット・質が 機械翻訳に適していない 人手による「やさしい日本語」 換言辞書の有効性を調査
研究目的
コーパス 6 公的文書を日本語教師が3段階の 「やさしい日本語」に訳したもの ➢逐語訳 難しい表現 ⇒ 「やさしい」表現 (逐語的に訳したもの) ➢意訳 文意等を損なわないように可能な限り
「やさしい日本語」に換言 ➢要約 可能な限り文を簡約化
辞書の作成方法 7 原文と逐語訳を使用 コーパス例) 原文 …世界的に新型(豚)インフルエンザ の流行が危惧されています。
逐語訳…世界中で新型インフルエンザ の流行が心配されています。 「世界的に」が「世界中で」に換言…等
換言辞書の内容(1/3) 8 換言例) 単語: 接種 ⇒ 注射 複合名詞:
任意接種 ⇒ 任意の注射 年号: 平成21年 ⇒ 2009年 補助動詞: お読みいただき ⇒ 読んで 敬語等: たまわりまして ⇒ いただき
換言辞書の内容(2/3) 9 換言例) 省略: ~等、~を対象、各~ 補完: (月) ⇒
(月曜日) (カッコ)の情報: 新型(豚)インフルエンザ ⇒ 新型インフルエンザ 低学年(3年生まで) ⇒ 3年生まで
換言辞書の内容(3/3) 10 逐語的ではない換言例) 助成措置が講じられておりますので ⇒ 少し安くなりますから 保護者の皆様のご理解とご協力を ⇒ 皆さん、どうか理解と協力を お願いします。
評価実験 11 換言辞書の内容から20文の評価データを 作成し、評価のための小規模実験を行った。 ➢被験者:留学生2名 ➢評価方法:4種類 ①元の文の方がやさしく感じる ②換言後の方がやさしく感じる
③どちらもやさしく感じる ④どちらも難しく感じる
評価実験 12 評価データ例) 換言前:平成22年8月16日(月)~20日(金) に市立病院にて予防接種を行います。 換言後:2010年8月16日(月曜日)~20日(金曜日) に市立病院で予防注射を行います。 ⇒ 結果:換言後がやさしいと判断 …平均15.5文
/ 20文
考察 13 複合名詞の分割 予定人数→ 予定の人数 必要書類→ 必要な書類
地区住民→ 地区に住んでいる人 敬語…尊敬語・謙譲語 ⇒ これらを解消することで やさしくなった。
結論 14 人手で作成した換言辞書の評価 →20文中15.5文がやさしいと判断 ⇒辞書の有効性が確認できた。 複合名詞と敬語の問題を解消すると 日本語はやさしくなり、日本語初学者 の理解を助ける。
今後の課題 15 換言辞書の完成 換言辞書を用いた換言システムの作成