Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150820 文献紹介
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuta
August 19, 2015
Education
200
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20150820 文献紹介
Yuta
August 19, 2015
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
230
20160218 文献紹介
sudo
0
270
20150909 発表資料
sudo
0
150
20150708 文献紹介
sudo
0
170
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
20150415 文献紹介
sudo
1
240
Other Decks in Education
See All in Education
[2026前期火5] 論理学(京都大学文学部 前期 第3回)「形式言語と四つのキーワード:メタ・構成・意味論・ハーモニー」
yatabe
0
570
[2026前期火5] 論理学(京都大学文学部 前期 第8回)「正規化定理の証明」
yatabe
0
200
0506
cbtlibrary
0
200
Dashboards - Lecture 11 - Information Visualisation (4019538FNR)
signer
PRO
1
2.7k
SARA Annual Report 2025-26
sara2023
1
380
Lectura 2 (PIT : Python Basico)
robintux
0
360
Padlet opetuksessa
matleenalaakso
12
16k
Data Management and Analytics Specialisation
signer
PRO
0
1.9k
Public Space Is Not For Sale
drikkes
0
120
生成AIを授業の相棒にするデータサイエンス入門(「デジタル✕探究」イノベーターズフォーラム テクニカルセッション講演資料)
datascientistsociety
PRO
0
310
[2026前期火5] 論理学(京都大学文学部 前期 第11回)「ハーモニー:三層モデルと保存拡大」
yatabe
0
130
Course Review - Lecture 13 - Next Generation User Interfaces (4018166FNR)
signer
PRO
0
2.3k
Featured
See All Featured
The Pragmatic Product Professional
lauravandoore
37
7.3k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
SEO for Brand Visibility & Recognition
aleyda
0
4.6k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.5k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
260
Code Review Best Practice
trishagee
74
20k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
610
Abbi's Birthday
coloredviolet
3
8.3k
Accessibility Awareness
sabderemane
1
140
Transcript
文献紹介 「やさしい日本語」作成支援のための 日本語の難易度自動推定の検討 張 萌, 伊藤 彰則, 佐藤 和之 研究報告音声言語情報処理(SLP)
2012-SLP-91 6 PP.1-6 自然言語処理研究室 B4 須戸悠太 1
概要 • 外国人の感覚に合った日本語の難易度自動 推定について検討 • leave-one-out クロスバリデーションで評価し た結果、外国人の主観評価値と自動推定値 の相関は約0.66となった。 2
やさしい日本語 • 日本語能力検定試験3級を合格した人が理 解可能なレベルを想定 – 3級、4級程度の語彙を使うことが望ましい • あいまいな表現を避け、可能な限り直接的に 表現する 3
普通の日本語 直ちに高台に避難してください。 やさしい日本語 すぐに高いところに逃げてください。
日本語の難易度のモデル化 • = 1 ⋮ 1 1 1 ⋮ 1
⋯ ⋱ ⋯ 1 ⋮ • = 1 ⋯ • リッジ回帰によるモデルパラメー タの推定は以下のようになる • = + −1 4 :日本語文の特徴ベクトル ():難易度スコア :モデルパラメータ :単位行列 (> 0):リッジパラメータ
日本語の難易度に関連する特徴量 • 作成基準 – 文の構造を簡単にする – 難しい日本語を使わない – 外来語を使わない •
文の構造 – 文の長さ、各品詞の数・割合、文節数、係り受け の距離・回数について検討 5
日本語の難易度に関連する特徴量 • 単語レベル – (旧)日本語能力検定試験の語彙レベルを利用 • 外来語 – 全ての文字シンボルがカタカナの形態素を、外来 語とみなす
• 文字シンボル – ひらがな、カタカナ、漢字のそれぞれの割合 6
評価実験 • データ – 東日本大震災において外国人のために書かれた 文章400文を抽出 – 中国人留学生30人に以下の基準で難易度の評 価を行ってもらった 7
評価基準 評価値 完全に分かる 2 ちょっと理解できる 1 全然分からない 0
各特徴量の有効性 8
自動推定の評価 • 実験データ400文のうち、399文を学習データ としてモデルパラメータを求めるのに利用 • 残り1文を評価データとする • リッジパラメータを変化させ、 leave-one-out クロスバリデーション実験を行った
9
自動推定の評価 10 • の調整により、相関が上がる
自動推定の評価 • 推定値と主観評価値の散布図( = 0.2) 11
自動推定の評価 • 2乗誤差最小基準よりリッジ回帰による推定 が有効であることが分かった • 日本語の難易度に関連すると考えられる基 準を組み合わせることで、ある程度自動で推 測可能であることが分かった 12