Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CompML : Elementary knowledge for 'Parameter-Free Online Optimization'
Search
sarrrrry
January 15, 2021
Technology
1
100
CompML : Elementary knowledge for 'Parameter-Free Online Optimization'
sarrrrry
January 15, 2021
Tweet
Share
More Decks by sarrrrry
See All by sarrrrry
点過程の基礎とその周辺
sarrrrry
0
130
みずほ銀行の2021年大規模システム障害に関する考察
sarrrrry
0
130
CompML:PaperReading-PHM-No.1
sarrrrry
0
130
PaperReading-ExplainingKnowledgeDistillationByQuantifyingTheKnowledge
sarrrrry
0
33
Other Decks in Technology
See All in Technology
10分でわかるfreeeのQA
freee
0
210
エバンジェリスト活動を7年やってきて見えてきた、コミュニティとエバンジェリストの関係
soracom
PRO
1
190
チーム単位で保守性を高める:独自指標と向上にむけた実践
tarappo
0
290
初心者が行く!サーバレスWebアプリ開発の道
nagaharutogawa
0
440
Oracle Database で機械学習を始めよう! Oracle Machine Learning
oracle4engineer
PRO
1
140
私のRSpecの書き方 / How I write RSpec
tmtms
4
820
.NETの非同期戦略とUnityとの相互運用
neuecc
2
2.4k
暗黙知を集積するプラットフォーム : 「健常者エミュレータ事例集」の取り組み
sora32127
1
160
XRミーティング 2024-03-20
1ftseabass
PRO
0
100
マイクロサービス環境におけるDB戦略 in DMMプラットフォーム
pospome
11
3k
Cloud Friendly(?) Jenkins. How we failed to make Jenkins cloud native and what we learned?
onenashev
PRO
0
110
検証からプロダクトへ: シームレスなLLM開発の ためのしくみ作り
nunukim
1
100
Featured
See All Featured
Navigating Team Friction
lara
177
13k
How to Ace a Technical Interview
jacobian
272
22k
Bash Introduction
62gerente
604
210k
Building an army of robots
kneath
300
41k
Reflections from 52 weeks, 52 projects
jeffersonlam
343
19k
Why Our Code Smells
bkeepers
PRO
330
56k
The Mythical Team-Month
searls
214
42k
Keith and Marios Guide to Fast Websites
keithpitt
407
22k
Faster Mobile Websites
deanohume
296
30k
What's new in Ruby 2.0
geeforr
335
31k
Facilitating Awesome Meetings
lara
39
5.5k
Building Effective Engineering Teams - LeadDev
addyosmani
25
1.8k
Transcript
None
None
【目的】 典型的な確率的最適化手法 など で必要とされる、 やその他のパラメータの調整を不必要にする事。 【 】 • • •
• •
エキスパート統合問題 問題設定 • 東京ドームで行われたあるクイズ大会に参加 • 制限時間内に答えだと思った方向に移動する ◯ 外野側、✕ 内野側 •
◯✕クイズが 問出題され、成績上位者が2次予選に進める 問題が分からなくても優勝経験のある 人を発見して、同じ動きをすれば良い ◦ 正解率が高いはずの優勝経験のある人をエキスパートと呼ぶ事にする ◦ 人のエキスパートと問題出題者をまとめて環境と呼ぶ事にする 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 環境がプレイヤーのアルゴリズム を知った上で、予測 ・ となるクイズを出題する ような、最悪の場合の解析を行う手法 この手法から を求める事が多い? 畑埜晃平,
& 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 • 素朴な戦略 の真似をする
◦ ミスの回数 たかだか 回 • 分法 の多数決に従う ◦ ミスの回数 たかだか • 乱択 分法 から 様ランダムに 人選び、その決定に従う ◦ ミスの回数 たかだか 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在しない場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社. アルゴリズム の 誤り回数の期待値 エキスパートの 誤り回数の最小値
エキスパート統合問題 乱択2分法 再掲 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 別の問題設定 オンライン配分問題 複数の投資先の銘柄 あるいはアルゴリズムやサーバ等選択肢 が与えられたとき、 持っている資源をうまく配分する事で損失を最小化する問題を考える 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 エキスパートの予測集合の扱い • エキスパート統合問題 ◦ 乱択2分法の変更 重み付き平均アルゴリズム ▪ 単純な問題として定式化 •
どんなエキスパート統合問題 も確率ベクトル集合を予測集合とし、各エキスパート は常 に単位ベクトルを予測するものに限定した問題に還元できる 標準化 • 標準化したオンライン配分問題に対する を ヘッジアルゴリズム と呼ぶ • エキスパートの予測を単位ベクトルではなく、一般化して凸集合であるとした枠組み をオンライン凸最適化 と呼ぶ
エキスパート統合問題 エキスパート統合問題 標準形 ↪ 一般化 オンライン凸最適化問題 予測値集合 凸集合 ↪ 特殊ケース
オンライン線形最適化問題
論文 • ◦ ◦ 基準 をベースにした 推定量を用いて、 なオンライン最適化 手法の提案 他の論文解説はこちら
https://github.com/CompML/survey-stochastic-optimization/issues