Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
統計的学習理論の基礎 I
Search
Masanari Kimura
December 11, 2020
Research
3
550
統計的学習理論の基礎 I
Masanari Kimura
December 11, 2020
Tweet
Share
More Decks by Masanari Kimura
See All by Masanari Kimura
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
330
機械学習における重要度重み付けとその応用
mkimura
3
3.1k
Paper Intro: Human Rademacher Complexity
mkimura
0
180
On the principle of Invariant Risk Minimization
mkimura
0
350
論文紹介:Clustering with Bregman Divergences: an Asymptotic Analysis
mkimura
0
570
Generalization Bounds for Set-to-Set Matching with Negative Sampling
mkimura
0
170
論文紹介:On the Importance of Gradients for Detecting Distributional Shifts in the Wild
mkimura
2
780
論文紹介:Dangers of Bayesian Model Averaging under Covariate Shift
mkimura
0
340
Information Geometry of Dropout Training
mkimura
0
320
Other Decks in Research
See All in Research
大学見本市2025 JSTさきがけ事業セミナー「顔の見えないセンシング技術:多様なセンサにもとづく個人情報に配慮した人物状態推定」
miso2024
0
200
大規模言語モデルにおけるData-Centric AIと合成データの活用 / Data-Centric AI and Synthetic Data in Large Language Models
tsurubee
1
460
Community Driveプロジェクト(CDPJ)の中間報告
smartfukushilab1
0
110
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
120
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
Learning to (Learn at Test Time): RNNs with Expressive Hidden States
kurita
1
300
生成的情報検索時代におけるAI利用と認知バイアス
trycycle
PRO
0
130
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
2
920
HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery
satai
3
390
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
15
18k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
110
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
460
Featured
See All Featured
Odyssey Design
rkendrick25
PRO
0
440
Paper Plane (Part 1)
katiecoart
PRO
0
2.2k
Believing is Seeing
oripsolob
0
16
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
270
Facilitating Awesome Meetings
lara
57
6.7k
Optimizing for Happiness
mojombo
379
70k
Reality Check: Gamification 10 Years Later
codingconduct
0
1.9k
AI: The stuff that nobody shows you
jnunemaker
PRO
1
28
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
70k
4 Signs Your Business is Dying
shpigford
187
22k
Transcript
CompML 統計的学習理論の基礎 I Masanari Kimura (@machinery81)
CompML TL;DR • 統計的学習理論の基礎的な事項のまとめ • 第一回は以下のトピックについて: • 種々の収束概念 • 確率収束
• 概収束 • UCEP property • ASCEP property • UCEM property • PAC Learning 2
CompML Uniform Convergence
CompML (, ):可測空間,:確率測度 からi.i.d.に生成された! , … , " から計算される ∈
の経験確率 + ; " = ## ∈ = 1 1 #$! " % # 気になるのは, • + (; " )がちゃんと()に収束するのか? • もしそうならば,どのように収束するのか? 4 経験確率(Empirical Probability)
CompML 確率収束(Converges in Probability) 定義.ある > 0について ! % ;
! − () > → 0 ( → ∞) のとき, % (; ! )は()に確率収束するという. 同値な表現として, ∀, > 0, ∃" , > 0 . . ! % ; ! − > ≤ ∀ ≥ "
CompML 概収束(Converges almost surely) 定義.経験確率について # % ; ! →
→ ∞ = 1 となるとき, % (; ! )は()に概収束するという. 概収束は確率収束より強い: % ; ! $.&. () ⟹ % (; ! ) → ' ()
CompML 経験確率は真の確率に確率収束する (証明)インジケータ関数( ()はBernoulli過程とみなせる: ( = 1 = 従って,Chernoffの不等式から !
% ; ! − () > ≤ 2 exp −2) が得られる.従って, → ∞で ! % ; ! − () > → 0であるので, % (; ! )は()に確率収束することが証明された. □ 実はもっと強く,経験確率は真の確率に概収束する.
CompML UCEP; Uniform Convergence of Empirical Probabilities 単一のではなく,その集合 ⊂ を考える.
定義.あるについて, ! sup (∈ % − () > → 0 ( → 0) が成り立つとき,はUCEP propertyを持つという.
CompML ASCEP; Almost Sure Convergence of Empirical Probabilities 定義.あるについて, #
sup (∈ % ! − () → 0 → ∞ = 1 が成り立つとき,はASCEP propertyを持つという.
CompML UCEM; Uniform Convergence of Empirical Means 確率変数についての関数の経験平均を以下のように書く: F ()
= 1 I ,-. ! , 定義.ある関数クラスℱについて, ! sup /∈ℱ F − > → 0 ( → 0) が成り立つとき,ℱはUCEM propertyを持つという.
CompML PAC Learning
CompML Learning Concepts • 未知の関数または概念を学習するとはどういうことか? • より強くいうと,汎化するとはどういうことか? • 学習理論における基本的なパーツは ◦
集合 ◦ 加法族 ◦ 可測空間(, )の確率測度のクラス ◦ conceptクラス ⊂ または関数クラスℱ
CompML Concept Learning 目的は,観測. , … , ! に基づいて未知のtarget concept
∈ を学習すること. • 各, について,それがに含まれるかどうかを1 (, )で表す(オラクル) • これらのペアから,写像の族(アルゴリズム)を考える: ! : × 0,1 ! → このアルゴリズムによって生成される仮説(hypothesis) ! = ! . , 1 . , … , ! , 1 !
CompML PAC学習可能;Probability Approximately Correct 定義.アルゴリズム! は以下を満たすとき精度でPAC学習可能であるという: sup 1∈2 ! 3
, ! > → 0 ( → 0) ここで3 は仮説とtarget conceptの間の何らかのエラーに当たる. 同値な表現:! は任意の, > 0について,ある" (, )が存在して以下を満た すときPAC学習可能: ! 3 , ! > ≤ , ∀ ≥ "
CompML まとめ • 統計的学習理論の準備として幾つかの基礎的な事項をまとめた • 確率収束,概収束 • PAC学習可能性
CompML 参考文献 • Shalev-Shwartz, S., Ben-David, S. (2014). Understanding Machine
Learning - From Theory to Algorithms.. Cambridge University Press. ISBN: 978-1-10-705713-5 • Mohri, Mehryar, Afshin Rostamizadeh, and Ameet Talwalkar. Foundations of machine learning. MIT press, 2018.