Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CompML : Elementary knowledge for 'Parameter-Fr...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
sarrrrry
January 15, 2021
Technology
130
1
Share
CompML : Elementary knowledge for 'Parameter-Free Online Optimization'
sarrrrry
January 15, 2021
More Decks by sarrrrry
See All by sarrrrry
点過程の基礎とその周辺
sarrrrry
0
280
みずほ銀行の2021年大規模システム障害に関する考察
sarrrrry
1
170
CompML:PaperReading-PHM-No.1
sarrrrry
0
190
PaperReading-ExplainingKnowledgeDistillationByQuantifyingTheKnowledge
sarrrrry
0
53
Other Decks in Technology
See All in Technology
毎日の作業を Claude Code 経由にしたら、 ノウハウがコードになった
kossykinto
1
1.3k
2026年春のAgentCoreアプデ 細かいやつ全部まとめ
minorun365
4
230
Vision Banana: Image Generators are Generalist Vision Learners
kzykmyzw
0
380
いつの間にかデータエンジニア以外の業務も増えていたけど、意外と経験が役に立ってる
zozotech
PRO
0
560
アプリブロック機能のつくりかたと、AIとHTMLの不合理な相性の良さについて
kumamotone
1
250
可視化から活用へ — Mesh化・Segmentation・アライメントの研究動向
gpuunite_official
0
190
拝啓、あの夏の僕へ〜あなたも知っているApp Runnerの世界〜
news_it_enj
0
240
"うちにはまだ早い"は本当? ─ 小さく始めるPlatform Engineering入門
harukasakihara
6
550
試作とデモンストレーション / Prototyping and Demonstrations
ks91
PRO
0
200
ワールドカフェ再び、そしてゴール・ルール・ロール・ツール / World Café Revisited, and the Goals-Rules-Roles-Tools
ks91
PRO
0
160
小さいVue.jsを30分で作る
hal_spidernight
0
150
AWS WAFの運用を地道に改善し、自社で運用可能にするプラクティス
andpad
1
140
Featured
See All Featured
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Abbi's Birthday
coloredviolet
2
7.5k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Deep Space Network (abreviated)
tonyrice
0
130
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
The SEO identity crisis: Don't let AI make you average
varn
0
460
Building an army of robots
kneath
306
46k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
300
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
280
Transcript
None
None
【目的】 典型的な確率的最適化手法 など で必要とされる、 やその他のパラメータの調整を不必要にする事。 【 】 • • •
• •
エキスパート統合問題 問題設定 • 東京ドームで行われたあるクイズ大会に参加 • 制限時間内に答えだと思った方向に移動する ◯ 外野側、✕ 内野側 •
◯✕クイズが 問出題され、成績上位者が2次予選に進める 問題が分からなくても優勝経験のある 人を発見して、同じ動きをすれば良い ◦ 正解率が高いはずの優勝経験のある人をエキスパートと呼ぶ事にする ◦ 人のエキスパートと問題出題者をまとめて環境と呼ぶ事にする 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 環境がプレイヤーのアルゴリズム を知った上で、予測 ・ となるクイズを出題する ような、最悪の場合の解析を行う手法 この手法から を求める事が多い? 畑埜晃平,
& 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 • 素朴な戦略 の真似をする
◦ ミスの回数 たかだか 回 • 分法 の多数決に従う ◦ ミスの回数 たかだか • 乱択 分法 から 様ランダムに 人選び、その決定に従う ◦ ミスの回数 たかだか 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在しない場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社. アルゴリズム の 誤り回数の期待値 エキスパートの 誤り回数の最小値
エキスパート統合問題 乱択2分法 再掲 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 別の問題設定 オンライン配分問題 複数の投資先の銘柄 あるいはアルゴリズムやサーバ等選択肢 が与えられたとき、 持っている資源をうまく配分する事で損失を最小化する問題を考える 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 エキスパートの予測集合の扱い • エキスパート統合問題 ◦ 乱択2分法の変更 重み付き平均アルゴリズム ▪ 単純な問題として定式化 •
どんなエキスパート統合問題 も確率ベクトル集合を予測集合とし、各エキスパート は常 に単位ベクトルを予測するものに限定した問題に還元できる 標準化 • 標準化したオンライン配分問題に対する を ヘッジアルゴリズム と呼ぶ • エキスパートの予測を単位ベクトルではなく、一般化して凸集合であるとした枠組み をオンライン凸最適化 と呼ぶ
エキスパート統合問題 エキスパート統合問題 標準形 ↪ 一般化 オンライン凸最適化問題 予測値集合 凸集合 ↪ 特殊ケース
オンライン線形最適化問題
論文 • ◦ ◦ 基準 をベースにした 推定量を用いて、 なオンライン最適化 手法の提案 他の論文解説はこちら
https://github.com/CompML/survey-stochastic-optimization/issues