Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20150909 発表資料
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuta
September 09, 2015
Education
150
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20150909 発表資料
Yuta
September 09, 2015
More Decks by Yuta
See All by Yuta
20160422 文献紹介
sudo
0
180
NLP2016 報告
sudo
0
200
NLP2016 発表スライド
sudo
0
230
20160218 文献紹介
sudo
0
270
20150820 文献紹介
sudo
0
200
20150708 文献紹介
sudo
0
170
20150610 文献紹介
sudo
0
200
20150512 文献紹介
sudo
0
190
20150415 文献紹介
sudo
1
240
Other Decks in Education
See All in Education
Padlet opetuksessa
matleenalaakso
12
16k
生成AI時代のエンジニア育成について考えてみた
akasan
0
160
2026年度春学期 統計学 第5回 分布をまとめるー記述統計量(平均・分散など) (2026. 5. 7)
akiraasano
PRO
0
150
勝手にCULTIBASE で広げよう、探究の輪! - CULTIVAL 2026
hiroc_sk
1
230
Estimating Group × Time Interaction in Scale-Transformed CEFR-J Self-Assessment Scores: A Case in Study-Abroad Research
uranoken
0
110
Visionary Initiative: Future Intelligence 「未来の知性と社会の礎を築く」|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
530
!コスパよくインターンに受かる方法!
ruribou
1
280
[2026前期火5] 論理学(京都大学文学部 前期 第4回)「 ならば(→)の導入と証明ネット」
yatabe
0
480
【セーフィー】テクニカルライティング&コミュニケーション実践講座(26新卒エンジニア向け研修資料)
ymzaki_m4
0
230
Data Physicalisation - Lecture 9 - Next Generation User Interfaces (4018166FNR)
signer
PRO
1
1.1k
✅ レポート採点基準 / How Your Reports Are Assessed
yasslab
PRO
0
370
Visionary Initiative: Materials-Positive Society 「モノの進化をポジティブな社会の原動力に」|Science Tokyo(東京科学大学)
sciencetokyo
PRO
0
510
Featured
See All Featured
WENDY [Excerpt]
tessaabrams
11
38k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
Deep Space Network (abreviated)
tonyrice
0
210
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.7k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.6k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.2k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
370
Designing for Timeless Needs
cassininazir
1
260
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
750
Heart Work Chapter 1 - Part 1
lfama
PRO
8
36k
Transcript
文献紹介 決定リストを弱学習器とした アダブーストによる日本語単語分割 新納 浩幸 自然言語処理 Vol.8 (2001) No.2 P3-18
自然言語処理研究室 B4 須戸悠太 1
概要 • 決定リストを弱学習器としたアダブーストによる日本 語単語分割法を提案 • 各文字の間に単語区切りを置くか置かないかの分 類問題として定式化 – 未知語の問題を受けない •
京大コーパスを利用し作成した決定リストによる単 語分割の正解率は97.52%であった 2
単語分割と分類問題 • 文字からなる入力文をs = 1 2 ⋯ とすると、単 語分割は文字 と+1
の間 とする に単語境界が ある(+1)かない(-1)かを与えることによって行える。 3
決定リスト • 帰納学習手法の一種 • 正解付きの訓練データから分類規則を学習する • 分類規則は証拠とクラスの組の順序付きの表となる – 証拠:属性とその属性の値の組 4
決定リスト作成の手順 • 1. 属性を設定する • 2. 訓練データから証拠とクラスの組の頻度を調べる • 3. 証拠の判別力と分類クラスを導く
• 4. 判断力の順に並べる 5
属性の設定 • 各文字間 がどのクラスに属するかの判断材料 • の属性として7種類 6
属性の設定 7 • 字種の大分類は以下の9種類 • 細分類は大分類の平仮名部分をその文字自身にし たもの
アダブーストの利用 • ブースティング方式の一つ • ポイントは不正解のデータに課す重みの与え方 – 得られた分類規則の誤り確率が小さいほど重みが大きく なるように設定 • 重みを頻度として与える
– 不正解である場合、各証拠の頻度に1ではなく、重み自身 を加える 8
アダブーストのアルゴリズム 9
文字 − モデルに基づく 単語分割法との比較 • データとして京大コーパスを利用し、35717文を訓練 データ、1234文をテストデータとした。 – テストデータ中の単語境界の判定位置は56411箇所 •
訓練データより作成した決定リストを用いた単語分 割の方が正解率は上回っていた。 10 手法 正解率 − モデル 92.76% 決定リスト 97.52%
ブースティングの効果 • アダブーストによる決定リストのブースティングの結 果、正解率が最大で98.49%となった。 11 ブースティングの回数
未知語の検出 • テストデータにのみ含まれる単語文字列(本実験に おける未知語)が1024個(832種類)存在 12