Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150820 文献紹介
Search
Yuta
August 19, 2015
Education
200
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20150820 文献紹介
Yuta
August 19, 2015
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
230
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150708 文献紹介
sudo
0
170
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
20150415 文献紹介
sudo
1
240
Other Decks in Education
See All in Education
NDIAS Automotive / IoT CTF 2026 Recap - Keyfob & OSINT
himitu23
0
130
Interaction - Lecture 10 - Information Visualisation (4019538FNR)
signer
PRO
0
2.7k
「機械学習と因果推論」入門 ② 回帰分析から因果分析へ
masakat0
0
720
「答えを出す」より「わかる」をつくる
kzkmaeda
1
180
[2026前期火5] 論理学(京都大学文学部 前期 第9回)「正規化の停止性——ヒドラゲームによる証明」
yatabe
0
150
View Manipulation and Reduction - Lecture 9 - Information Visualisation (4019538FNR)
signer
PRO
1
2.7k
焦燥を平穏に変えるエンジニアのための哲学
ichimichi
5
4.4k
SARA Annual Report 2025-26
sara2023
1
380
0513
cbtlibrary
0
200
生成AIを授業の相棒にするデータサイエンス入門(「デジタル✕探究」イノベーターズフォーラム テクニカルセッション講演資料)
datascientistsociety
PRO
0
310
教育現場から見た Ruby on Rails
yasslab
PRO
0
180
[2026前期火5] 論理学(京都大学文学部 前期 第4回)「 ならば(→)の導入と証明ネット」
yatabe
0
480
Featured
See All Featured
Become a Pro
speakerdeck
PRO
31
6k
Paper Plane (Part 1)
katiecoart
PRO
0
9.3k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.8k
How STYLIGHT went responsive
nonsquared
100
6.2k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
For a Future-Friendly Web
brad_frost
183
10k
The Curious Case for Waylosing
cassininazir
1
410
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
170
Optimising Largest Contentful Paint
csswizardry
37
3.7k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
Into the Great Unknown - MozCon
thekraken
41
2.6k
Transcript
文献紹介 「やさしい日本語」作成支援のための 日本語の難易度自動推定の検討 張 萌, 伊藤 彰則, 佐藤 和之 研究報告音声言語情報処理(SLP)
2012-SLP-91 6 PP.1-6 自然言語処理研究室 B4 須戸悠太 1
概要 • 外国人の感覚に合った日本語の難易度自動 推定について検討 • leave-one-out クロスバリデーションで評価し た結果、外国人の主観評価値と自動推定値 の相関は約0.66となった。 2
やさしい日本語 • 日本語能力検定試験3級を合格した人が理 解可能なレベルを想定 – 3級、4級程度の語彙を使うことが望ましい • あいまいな表現を避け、可能な限り直接的に 表現する 3
普通の日本語 直ちに高台に避難してください。 やさしい日本語 すぐに高いところに逃げてください。
日本語の難易度のモデル化 • = 1 ⋮ 1 1 1 ⋮ 1
⋯ ⋱ ⋯ 1 ⋮ • = 1 ⋯ • リッジ回帰によるモデルパラメー タの推定は以下のようになる • = + −1 4 :日本語文の特徴ベクトル ():難易度スコア :モデルパラメータ :単位行列 (> 0):リッジパラメータ
日本語の難易度に関連する特徴量 • 作成基準 – 文の構造を簡単にする – 難しい日本語を使わない – 外来語を使わない •
文の構造 – 文の長さ、各品詞の数・割合、文節数、係り受け の距離・回数について検討 5
日本語の難易度に関連する特徴量 • 単語レベル – (旧)日本語能力検定試験の語彙レベルを利用 • 外来語 – 全ての文字シンボルがカタカナの形態素を、外来 語とみなす
• 文字シンボル – ひらがな、カタカナ、漢字のそれぞれの割合 6
評価実験 • データ – 東日本大震災において外国人のために書かれた 文章400文を抽出 – 中国人留学生30人に以下の基準で難易度の評 価を行ってもらった 7
評価基準 評価値 完全に分かる 2 ちょっと理解できる 1 全然分からない 0
各特徴量の有効性 8
自動推定の評価 • 実験データ400文のうち、399文を学習データ としてモデルパラメータを求めるのに利用 • 残り1文を評価データとする • リッジパラメータを変化させ、 leave-one-out クロスバリデーション実験を行った
9
自動推定の評価 10 • の調整により、相関が上がる
自動推定の評価 • 推定値と主観評価値の散布図( = 0.2) 11
自動推定の評価 • 2乗誤差最小基準よりリッジ回帰による推定 が有効であることが分かった • 日本語の難易度に関連すると考えられる基 準を組み合わせることで、ある程度自動で推 測可能であることが分かった 12