Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計的学習理論の基礎 I
Search
Masanari Kimura
December 11, 2020
Research
3
490
統計的学習理論の基礎 I
Masanari Kimura
December 11, 2020
Tweet
Share
More Decks by Masanari Kimura
See All by Masanari Kimura
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
250
機械学習における重要度重み付けとその応用
mkimura
3
2.4k
Paper Intro: Human Rademacher Complexity
mkimura
0
120
On the principle of Invariant Risk Minimization
mkimura
0
260
論文紹介:Clustering with Bregman Divergences: an Asymptotic Analysis
mkimura
0
450
Generalization Bounds for Set-to-Set Matching with Negative Sampling
mkimura
0
110
論文紹介:On the Importance of Gradients for Detecting Distributional Shifts in the Wild
mkimura
2
570
論文紹介:Dangers of Bayesian Model Averaging under Covariate Shift
mkimura
0
300
Information Geometry of Dropout Training
mkimura
0
250
Other Decks in Research
See All in Research
論文紹介: COSMO: A Large-Scale E-commerce Common Sense Knowledge Generation and Serving System at Amazon (SIGMOD 2024)
ynakano
1
400
メールからの名刺情報抽出におけるLLM活用 / Use of LLM in extracting business card information from e-mails
sansan_randd
2
430
LLM 시대의 Compliance: Safety & Security
huffon
0
600
Global Evidence Summit (GES) 参加報告
daimoriwaki
0
240
医療支援AI開発における臨床と情報学の連携を円滑に進めるために
moda0
0
150
アプリケーションから知るモデルマージ
maguro27
0
260
地理空間情報と自然言語処理:「地球の歩き方旅行記データセット」の高付加価値化を通じて
hiroki13
1
190
メタヒューリスティクスに基づく汎用線形整数計画ソルバーの開発
snowberryfield
3
780
移動ビッグデータに基づく地理情報の埋め込みベクトル化
tam1110
0
240
国際会議ACL2024参加報告
chemical_tree
1
440
Leveraging LLMs for Unsupervised Dense Retriever Ranking (SIGIR 2024)
kampersanda
2
310
DeepSeek-R1の論文から読み解く背景技術
personabb
3
330
Featured
See All Featured
Six Lessons from altMBA
skipperchong
27
3.6k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.5k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.6k
Practical Orchestrator
shlominoach
186
10k
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
Building Your Own Lightsaber
phodgson
104
6.2k
We Have a Design System, Now What?
morganepeng
51
7.4k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Designing for humans not robots
tammielis
250
25k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
10
510
Facilitating Awesome Meetings
lara
52
6.2k
Transcript
CompML 統計的学習理論の基礎 I Masanari Kimura (@machinery81)
CompML TL;DR • 統計的学習理論の基礎的な事項のまとめ • 第一回は以下のトピックについて: • 種々の収束概念 • 確率収束
• 概収束 • UCEP property • ASCEP property • UCEM property • PAC Learning 2
CompML Uniform Convergence
CompML (, ):可測空間,:確率測度 からi.i.d.に生成された! , … , " から計算される ∈
の経験確率 + ; " = ## ∈ = 1 1 #$! " % # 気になるのは, • + (; " )がちゃんと()に収束するのか? • もしそうならば,どのように収束するのか? 4 経験確率(Empirical Probability)
CompML 確率収束(Converges in Probability) 定義.ある > 0について ! % ;
! − () > → 0 ( → ∞) のとき, % (; ! )は()に確率収束するという. 同値な表現として, ∀, > 0, ∃" , > 0 . . ! % ; ! − > ≤ ∀ ≥ "
CompML 概収束(Converges almost surely) 定義.経験確率について # % ; ! →
→ ∞ = 1 となるとき, % (; ! )は()に概収束するという. 概収束は確率収束より強い: % ; ! $.&. () ⟹ % (; ! ) → ' ()
CompML 経験確率は真の確率に確率収束する (証明)インジケータ関数( ()はBernoulli過程とみなせる: ( = 1 = 従って,Chernoffの不等式から !
% ; ! − () > ≤ 2 exp −2) が得られる.従って, → ∞で ! % ; ! − () > → 0であるので, % (; ! )は()に確率収束することが証明された. □ 実はもっと強く,経験確率は真の確率に概収束する.
CompML UCEP; Uniform Convergence of Empirical Probabilities 単一のではなく,その集合 ⊂ を考える.
定義.あるについて, ! sup (∈ % − () > → 0 ( → 0) が成り立つとき,はUCEP propertyを持つという.
CompML ASCEP; Almost Sure Convergence of Empirical Probabilities 定義.あるについて, #
sup (∈ % ! − () → 0 → ∞ = 1 が成り立つとき,はASCEP propertyを持つという.
CompML UCEM; Uniform Convergence of Empirical Means 確率変数についての関数の経験平均を以下のように書く: F ()
= 1 I ,-. ! , 定義.ある関数クラスℱについて, ! sup /∈ℱ F − > → 0 ( → 0) が成り立つとき,ℱはUCEM propertyを持つという.
CompML PAC Learning
CompML Learning Concepts • 未知の関数または概念を学習するとはどういうことか? • より強くいうと,汎化するとはどういうことか? • 学習理論における基本的なパーツは ◦
集合 ◦ 加法族 ◦ 可測空間(, )の確率測度のクラス ◦ conceptクラス ⊂ または関数クラスℱ
CompML Concept Learning 目的は,観測. , … , ! に基づいて未知のtarget concept
∈ を学習すること. • 各, について,それがに含まれるかどうかを1 (, )で表す(オラクル) • これらのペアから,写像の族(アルゴリズム)を考える: ! : × 0,1 ! → このアルゴリズムによって生成される仮説(hypothesis) ! = ! . , 1 . , … , ! , 1 !
CompML PAC学習可能;Probability Approximately Correct 定義.アルゴリズム! は以下を満たすとき精度でPAC学習可能であるという: sup 1∈2 ! 3
, ! > → 0 ( → 0) ここで3 は仮説とtarget conceptの間の何らかのエラーに当たる. 同値な表現:! は任意の, > 0について,ある" (, )が存在して以下を満た すときPAC学習可能: ! 3 , ! > ≤ , ∀ ≥ "
CompML まとめ • 統計的学習理論の準備として幾つかの基礎的な事項をまとめた • 確率収束,概収束 • PAC学習可能性
CompML 参考文献 • Shalev-Shwartz, S., Ben-David, S. (2014). Understanding Machine
Learning - From Theory to Algorithms.. Cambridge University Press. ISBN: 978-1-10-705713-5 • Mohri, Mehryar, Afshin Rostamizadeh, and Ameet Talwalkar. Foundations of machine learning. MIT press, 2018.