Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公的文書に対する「やさしい日本語」換言辞書作成のための調査
Search
自然言語処理研究室
March 31, 2011
Research
0
90
公的文書に対する「やさしい日本語」換言辞書作成のための調査
杢 真奈見, 山本 和英. 公的文書に対する「やさしい日本語」換言辞書作成のための調査. 言語処理学会第17回年次大会, pp.376-379 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
470
データサイエンス12_分類.pdf
jnlp
0
330
データサイエンス11_前処理.pdf
jnlp
0
450
Recurrent neural network based language model
jnlp
0
130
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
93
自然言語処理研究室 研究概要(2014年)
jnlp
0
110
自然言語処理研究室 研究概要(2015年)
jnlp
0
180
Other Decks in Research
See All in Research
EOGS: Gaussian Splatting for Efficient Satellite Image Photogrammetry
satai
4
270
LLM-as-a-Judge: 文章をLLMで評価する@教育機関DXシンポ
k141303
3
820
学生向けアンケート<データサイエンティストについて>
datascientistsociety
PRO
0
3.2k
AIによる画像認識技術の進化 -25年の技術変遷を振り返る-
hf149
6
3.5k
When Submarine Cables Go Dark: Examining the Web Services Resilience Amid Global Internet Disruptions
irvin
0
210
Vision And Languageモデルにおける異なるドメインでの継続事前学習が性能に与える影響の検証 / YANS2024
sansan_randd
1
110
Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery
satai
3
480
20250624_熊本経済同友会6月例会講演
trafficbrain
1
150
Principled AI ~深層学習時代における課題解決の方法論~
taniai
3
1.2k
【緊急警告】日本の未来設計図 ~沈没か、再生か。国民と断行するラストチャンス~
yuutakasan
0
130
電通総研の生成AI・エージェントの取り組みエンジニアリング業務向けAI活用事例紹介
isidaitc
1
250
20250502_ABEJA_論文読み会_スライド
flatton
0
170
Featured
See All Featured
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
How STYLIGHT went responsive
nonsquared
100
5.6k
YesSQL, Process and Tooling at Scale
rocio
173
14k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
48
5.4k
Side Projects
sachag
455
42k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
124
52k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.4k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.8k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.9k
Rails Girls Zürich Keynote
gr2m
94
14k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
17
950
Transcript
公的文書に対する 「やさしい日本語」換言辞書 作成のための調査 長岡技術科学大学 電気系 杢 真奈見 山本 和英 1
研究背景 2 現在、日本には十分な日本語能力を 持たない外国人が数十万人いる。 現支援策 … 多言語での情報提供 ⇒ 全情報を多言語化することは 難しく、時間・コスト的に負担 支援策として最善ではない
研究背景 3 日本語母語話者(日本人) 文法、語彙に制限をかけて日本語 から「やさしい日本語」へ換言 日本語初学者(外国人) 最低限の文法と語彙を習得 「やさしい日本語」
「やさしい日本語」 4 対象者:日本語初学者 →留学生や外国人労働者等の 日本語能力の低い人々 「やさしい」と難しいの定義 →最低限の文法、語彙を習得した
日本語初学者の判断 (使用コーパス:日本語教師の主観による判断)
既存研究 5 本研究と同じコーパスを用いて 統計的機械翻訳 (松田ら・2010) ⇒ 変換の精度が低かった ➔原因:コーパスのフォーマット・質が 機械翻訳に適していない 人手による「やさしい日本語」 換言辞書の有効性を調査
研究目的
コーパス 6 公的文書を日本語教師が3段階の 「やさしい日本語」に訳したもの ➢逐語訳 難しい表現 ⇒ 「やさしい」表現 (逐語的に訳したもの) ➢意訳 文意等を損なわないように可能な限り
「やさしい日本語」に換言 ➢要約 可能な限り文を簡約化
辞書の作成方法 7 原文と逐語訳を使用 コーパス例) 原文 …世界的に新型(豚)インフルエンザ の流行が危惧されています。
逐語訳…世界中で新型インフルエンザ の流行が心配されています。 「世界的に」が「世界中で」に換言…等
換言辞書の内容(1/3) 8 換言例) 単語: 接種 ⇒ 注射 複合名詞:
任意接種 ⇒ 任意の注射 年号: 平成21年 ⇒ 2009年 補助動詞: お読みいただき ⇒ 読んで 敬語等: たまわりまして ⇒ いただき
換言辞書の内容(2/3) 9 換言例) 省略: ~等、~を対象、各~ 補完: (月) ⇒
(月曜日) (カッコ)の情報: 新型(豚)インフルエンザ ⇒ 新型インフルエンザ 低学年(3年生まで) ⇒ 3年生まで
換言辞書の内容(3/3) 10 逐語的ではない換言例) 助成措置が講じられておりますので ⇒ 少し安くなりますから 保護者の皆様のご理解とご協力を ⇒ 皆さん、どうか理解と協力を お願いします。
評価実験 11 換言辞書の内容から20文の評価データを 作成し、評価のための小規模実験を行った。 ➢被験者:留学生2名 ➢評価方法:4種類 ①元の文の方がやさしく感じる ②換言後の方がやさしく感じる
③どちらもやさしく感じる ④どちらも難しく感じる
評価実験 12 評価データ例) 換言前:平成22年8月16日(月)~20日(金) に市立病院にて予防接種を行います。 換言後:2010年8月16日(月曜日)~20日(金曜日) に市立病院で予防注射を行います。 ⇒ 結果:換言後がやさしいと判断 …平均15.5文
/ 20文
考察 13 複合名詞の分割 予定人数→ 予定の人数 必要書類→ 必要な書類
地区住民→ 地区に住んでいる人 敬語…尊敬語・謙譲語 ⇒ これらを解消することで やさしくなった。
結論 14 人手で作成した換言辞書の評価 →20文中15.5文がやさしいと判断 ⇒辞書の有効性が確認できた。 複合名詞と敬語の問題を解消すると 日本語はやさしくなり、日本語初学者 の理解を助ける。
今後の課題 15 換言辞書の完成 換言辞書を用いた換言システムの作成