Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150820 文献紹介
Search
Yuta
August 19, 2015
Education
0
170
20150820 文献紹介
Yuta
August 19, 2015
Tweet
Share
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
160
NLP2016 報告
sudo
0
180
NLP2016 発表スライド
sudo
0
200
20160218 文献紹介
sudo
0
220
20150909 発表資料
sudo
0
140
20150708 文献紹介
sudo
0
150
20150610 文献紹介
sudo
0
170
20150512 文献紹介
sudo
0
180
20150415 文献紹介
sudo
1
190
Other Decks in Education
See All in Education
第33回 JAWS-UG札幌 クラウド女子会コラボ 勉強会
nagisa53
2
340
Human Perception and Colour Theory - Lecture 2 - Information Visualisation (4019538FNR)
signer
PRO
0
1.7k
人生の転機からチャンスを掴む「シュロスバーグの4Sモデル」/4s-models
yuko_yokouchi
0
200
Earthquake and Disaster Prevention Information for UTokyo International Students
utokyoissr2360
0
520
Information Architectures - Lecture 2 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
1.1k
Visivolio
addtobasic
0
140
HCL Notes 14.0 「スタイルの変更」で「3 設定の確認」を深掘り
harunakano
0
1.2k
aportacions valors 2024
cumclavis
PRO
0
100
Best Wedding day perfume
vicjon
0
240
Padlet opetuksessa
matleenalaakso
3
11k
Design Guidelines and Principles - Lecture 7 - Information Visualisation (4019538FNR)
signer
PRO
0
1.6k
Canva
matleenalaakso
0
100
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
67
38k
Statistics for Hackers
jakevdp
789
220k
Reflections from 52 weeks, 52 projects
jeffersonlam
343
19k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
272
12k
GraphQLとの向き合い方2022年版
quramy
28
12k
What's new in Ruby 2.0
geeforr
335
31k
Keith and Marios Guide to Fast Websites
keithpitt
407
22k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
185
15k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
28
5.9k
The Brand Is Dead. Long Live the Brand.
mthomps
48
21k
Principles of Awesome APIs and How to Build Them.
keavy
119
16k
The Illustrated Children's Guide to Kubernetes
chrisshort
28
46k
Transcript
文献紹介 「やさしい日本語」作成支援のための 日本語の難易度自動推定の検討 張 萌, 伊藤 彰則, 佐藤 和之 研究報告音声言語情報処理(SLP)
2012-SLP-91 6 PP.1-6 自然言語処理研究室 B4 須戸悠太 1
概要 • 外国人の感覚に合った日本語の難易度自動 推定について検討 • leave-one-out クロスバリデーションで評価し た結果、外国人の主観評価値と自動推定値 の相関は約0.66となった。 2
やさしい日本語 • 日本語能力検定試験3級を合格した人が理 解可能なレベルを想定 – 3級、4級程度の語彙を使うことが望ましい • あいまいな表現を避け、可能な限り直接的に 表現する 3
普通の日本語 直ちに高台に避難してください。 やさしい日本語 すぐに高いところに逃げてください。
日本語の難易度のモデル化 • = 1 ⋮ 1 1 1 ⋮ 1
⋯ ⋱ ⋯ 1 ⋮ • = 1 ⋯ • リッジ回帰によるモデルパラメー タの推定は以下のようになる • = + −1 4 :日本語文の特徴ベクトル ():難易度スコア :モデルパラメータ :単位行列 (> 0):リッジパラメータ
日本語の難易度に関連する特徴量 • 作成基準 – 文の構造を簡単にする – 難しい日本語を使わない – 外来語を使わない •
文の構造 – 文の長さ、各品詞の数・割合、文節数、係り受け の距離・回数について検討 5
日本語の難易度に関連する特徴量 • 単語レベル – (旧)日本語能力検定試験の語彙レベルを利用 • 外来語 – 全ての文字シンボルがカタカナの形態素を、外来 語とみなす
• 文字シンボル – ひらがな、カタカナ、漢字のそれぞれの割合 6
評価実験 • データ – 東日本大震災において外国人のために書かれた 文章400文を抽出 – 中国人留学生30人に以下の基準で難易度の評 価を行ってもらった 7
評価基準 評価値 完全に分かる 2 ちょっと理解できる 1 全然分からない 0
各特徴量の有効性 8
自動推定の評価 • 実験データ400文のうち、399文を学習データ としてモデルパラメータを求めるのに利用 • 残り1文を評価データとする • リッジパラメータを変化させ、 leave-one-out クロスバリデーション実験を行った
9
自動推定の評価 10 • の調整により、相関が上がる
自動推定の評価 • 推定値と主観評価値の散布図( = 0.2) 11
自動推定の評価 • 2乗誤差最小基準よりリッジ回帰による推定 が有効であることが分かった • 日本語の難易度に関連すると考えられる基 準を組み合わせることで、ある程度自動で推 測可能であることが分かった 12