Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150820 文献紹介
Search
Yuta
August 19, 2015
Education
0
190
20150820 文献紹介
Yuta
August 19, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
170
NLP2016 報告
sudo
0
190
NLP2016 発表スライド
sudo
0
220
20160218 文献紹介
sudo
0
260
20150909 発表資料
sudo
0
140
20150708 文献紹介
sudo
0
160
20150610 文献紹介
sudo
0
190
20150512 文献紹介
sudo
0
180
20150415 文献紹介
sudo
1
230
Other Decks in Education
See All in Education
1014
cbtlibrary
0
500
焦りと不安を、技術力に変える方法 - 新卒iOSエンジニアの失敗談と成長のフレームワーク
hypebeans
1
600
自分だけの、誰も想像できないキャリアの育て方 〜偶然から始めるキャリアプラン〜 / Career planning starting by luckly v2
vtryo
1
320
Human Perception and Cognition - Lecture 4 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
1.2k
外国籍エンジニアの挑戦・新卒半年後、気づきと成長の物語
hypebeans
0
650
附属科学技術高等学校の概要|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
2.9k
JavaScript - Lecture 6 - Web Technologies (1019888BNR)
signer
PRO
0
3.1k
【ZEPホスト用メタバース校舎操作ガイド】
ainischool
0
150
AIを使って最新研究 について調べて発表しよ う!
mickey_kubo
4
170
Entrepreneurship minor course at HSE 2025
karlov
0
150
子どものためのプログラミング道場『CoderDojo』〜法人提携例〜 / Partnership with CoderDojo Japan
coderdojojapan
PRO
4
17k
Introduction - Lecture 1 - Human-Computer Interaction (1023841ANR)
signer
PRO
0
2.7k
Featured
See All Featured
Code Reviewing Like a Champion
maltzj
527
40k
Code Review Best Practice
trishagee
74
19k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
The Pragmatic Product Professional
lauravandoore
37
7.1k
Music & Morning Musume
bryan
46
7k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.2k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
[SF Ruby Conf 2025] Rails X
palkan
0
530
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
Practical Orchestrator
shlominoach
190
11k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
1
100
4 Signs Your Business is Dying
shpigford
186
22k
Transcript
文献紹介 「やさしい日本語」作成支援のための 日本語の難易度自動推定の検討 張 萌, 伊藤 彰則, 佐藤 和之 研究報告音声言語情報処理(SLP)
2012-SLP-91 6 PP.1-6 自然言語処理研究室 B4 須戸悠太 1
概要 • 外国人の感覚に合った日本語の難易度自動 推定について検討 • leave-one-out クロスバリデーションで評価し た結果、外国人の主観評価値と自動推定値 の相関は約0.66となった。 2
やさしい日本語 • 日本語能力検定試験3級を合格した人が理 解可能なレベルを想定 – 3級、4級程度の語彙を使うことが望ましい • あいまいな表現を避け、可能な限り直接的に 表現する 3
普通の日本語 直ちに高台に避難してください。 やさしい日本語 すぐに高いところに逃げてください。
日本語の難易度のモデル化 • = 1 ⋮ 1 1 1 ⋮ 1
⋯ ⋱ ⋯ 1 ⋮ • = 1 ⋯ • リッジ回帰によるモデルパラメー タの推定は以下のようになる • = + −1 4 :日本語文の特徴ベクトル ():難易度スコア :モデルパラメータ :単位行列 (> 0):リッジパラメータ
日本語の難易度に関連する特徴量 • 作成基準 – 文の構造を簡単にする – 難しい日本語を使わない – 外来語を使わない •
文の構造 – 文の長さ、各品詞の数・割合、文節数、係り受け の距離・回数について検討 5
日本語の難易度に関連する特徴量 • 単語レベル – (旧)日本語能力検定試験の語彙レベルを利用 • 外来語 – 全ての文字シンボルがカタカナの形態素を、外来 語とみなす
• 文字シンボル – ひらがな、カタカナ、漢字のそれぞれの割合 6
評価実験 • データ – 東日本大震災において外国人のために書かれた 文章400文を抽出 – 中国人留学生30人に以下の基準で難易度の評 価を行ってもらった 7
評価基準 評価値 完全に分かる 2 ちょっと理解できる 1 全然分からない 0
各特徴量の有効性 8
自動推定の評価 • 実験データ400文のうち、399文を学習データ としてモデルパラメータを求めるのに利用 • 残り1文を評価データとする • リッジパラメータを変化させ、 leave-one-out クロスバリデーション実験を行った
9
自動推定の評価 10 • の調整により、相関が上がる
自動推定の評価 • 推定値と主観評価値の散布図( = 0.2) 11
自動推定の評価 • 2乗誤差最小基準よりリッジ回帰による推定 が有効であることが分かった • 日本語の難易度に関連すると考えられる基 準を組み合わせることで、ある程度自動で推 測可能であることが分かった 12