Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オッカムの剃刀と汎化誤差解析
Search
Masanari Kimura
August 31, 2021
Research
5.3k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
オッカムの剃刀と汎化誤差解析
Masanari Kimura
August 31, 2021
More Decks by Masanari Kimura
See All by Masanari Kimura
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
370
機械学習における重要度重み付けとその応用
mkimura
3
3.4k
Paper Intro: Human Rademacher Complexity
mkimura
0
240
On the principle of Invariant Risk Minimization
mkimura
0
400
論文紹介:Clustering with Bregman Divergences: an Asymptotic Analysis
mkimura
0
620
Generalization Bounds for Set-to-Set Matching with Negative Sampling
mkimura
0
190
論文紹介:On the Importance of Gradients for Detecting Distributional Shifts in the Wild
mkimura
2
900
論文紹介:Dangers of Bayesian Model Averaging under Covariate Shift
mkimura
0
380
Information Geometry of Dropout Training
mkimura
0
350
Other Decks in Research
See All in Research
「車1割削減、渋滞半減、公共交通2倍」を 熊本から岡山へ@RACDA設立30周年記念都市交通フォーラム2026
trafficbrain
1
1.2k
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
320
Fukui Shibiten 39 - AI Art
butchi
0
130
セマンティック通信勉強会 6Gに向けたデバイス間効率的な通信の技術紹介・課題・今後展望
satai
3
170
正規分布と最適化について
koide3
1
270
長時間動画QAにおけるマルチエージェント推論 ・SVAgent: Storyline-Guided Long Video Understanding via Cross-Modal Multi-Agent Collaboration
murakawatakuya
1
140
LLM の Attention 機構まとめ — 数式・計算量・メモリ
puwaer
8
2.2k
Harness Engineering and Al Agent
kzinmr
3
1.7k
Research Engineerという仕事 / Research Engineering: Bridging Research and Business
chck
1
220
Ankylosing Spondylitis
ankh2054
0
180
Unified Audio Source Separation (Defense Slides)
kohei_1979
1
620
ScoreMatchingRiesz for Automatic Debiased Machine Learning and Policy Path Estimation with an Application to Japanese Monetary Policy Evaluation
masakat0
0
290
Featured
See All Featured
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
240
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
370
A better future with KSS
kneath
240
18k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
A Soul's Torment
seathinner
6
3k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.7k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
480
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.8k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
Transcript
Intro Occan Bound Additional Discussions References オッカムの剃刀と汎化誤差解析 Masanari Kimura
[email protected]
August 31, 2021
Intro Occan Bound Additional Discussions References Intro 2/11
Intro Occan Bound Additional Discussions References TL;DR ▶ オッカムの剃刀の概念について説明; ▶
オッカムの剃刀の形式化と汎化誤差解析への応用について説明. 3/11
Intro Occan Bound Additional Discussions References オッカムの剃刀(Occam’s Razor) オッカム [Drouhin,
2006] 必要が無いなら多くのものを定立してはならない.少数の論理でよい場合は多数の論理を 定立してはならない. ▶ ある二つの理論が同程度にデータを説明できているとき,より単純な方が好まれる; ▶ 統計的機械学習において単純さは直感的にだけでなく定量的に測れる; ▶ 以下ではオッカムの剃刀を形式的に記述していく. 4/11
Intro Occan Bound Additional Discussions References Occan Bound 5/11
Intro Occan Bound Additional Discussions References Occam Bound Theorem 独立かつ同一なサンプルサイズ
m のデータセット S = {x, y} とある仮説 h ∈ H について 少なくとも 1 − δ の確率で以下が成り立つ: L(h) ≤ ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m . (1) ただし,|h| は仮説 h を記述するのに必要な bit 数であり, L(h) := E [ 1[h(x) ̸= y] ] , (2) ˆ L(h) := 1 m m ∑ i=1 1[h(xi) ̸= yi]. (3) 6/11
Intro Occan Bound Additional Discussions References Proof of the Occam
Bound Proof. 定理に矛盾する仮説集合を B とする: B := { L(h) ≥ ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m ; h ∈ H } (4) このとき, P [ h ∈ B ] ≤ ∑ h∈H exp { −2m (√ (ln 2)|h| + ln 1 δ 2m )2 } (∵ Chernoff bound) (5) = ∑ h∈H δ2−|h| = δ ∑ h∈H 2−|h| ≤ δ (∵ Kraft inequality) (6) 7/11
Intro Occan Bound Additional Discussions References Occam Bound と仮説選択 Occam
bound は期待誤差の上界を与えるので,これを最小化するように仮説選択をする ことが考えられる: ˆ h = arg min h∈H ˆ L(h) + √ (ln 2)|h| + ln 1 δ 2m . (7) ▶ この最適化は,手元へのデータの説明能力(第一項)とモデルのシンプルさ(第二 項)の最小化のトレードオフになっている; ▶ これは,ある h1 , h2 ∈ H がもし同じだけデータを説明できるとき,よりシンプルな方 が未知のデータへの誤差を小さくできる可能性が高いことを意味している; ▶ これはまさしくオッカムの剃刀の形式的な記述になっている. 8/11
Intro Occan Bound Additional Discussions References Additional Discussions 9/11
Intro Occan Bound Additional Discussions References Occam Bound のベイズ的解釈 P
を h に関する確率分布とし,|h|P を以下のように定義する: |h|P := log 2 1 P(h) . (8) このとき,Occam bound は次のように書き換えることができる: L(h) ≤ ˆ L(h) + √ (ln 2)|h|P + ln 1 δ 2m . (9) これはまさしく仮説集合に関する任意の事前分布を考えた場合の Occam bound に相当 する. 10/11
Intro Occan Bound Additional Discussions References References I Nicolas Drouhin.
Pluralitas non est ponenda sine neccesitate. Technical report, GRID Working paper, 2006. 11/11