Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CompML : Elementary knowledge for 'Parameter-Fr...
Search
sarrrrry
January 15, 2021
Technology
1
120
CompML : Elementary knowledge for 'Parameter-Free Online Optimization'
sarrrrry
January 15, 2021
Tweet
Share
More Decks by sarrrrry
See All by sarrrrry
点過程の基礎とその周辺
sarrrrry
0
170
みずほ銀行の2021年大規模システム障害に関する考察
sarrrrry
1
140
CompML:PaperReading-PHM-No.1
sarrrrry
0
170
PaperReading-ExplainingKnowledgeDistillationByQuantifyingTheKnowledge
sarrrrry
0
35
Other Decks in Technology
See All in Technology
AWSサービスアップデート 2024/12 Part3
nrinetcom
PRO
0
140
カップ麺の待ち時間(3分)でわかるPartyRockアップデート
ryutakondo
0
140
2024AWSで個人的にアツかったアップデート
nagisa53
1
110
データ基盤におけるIaCの重要性とその運用
mtpooh
4
510
AWSの生成AIサービス Amazon Bedrock入門!(2025年1月版)
minorun365
PRO
7
470
[IBM TechXchange Dojo]Watson Discoveryとwatsonx.aiでRAGを実現!事例のご紹介+座学②
siyuanzh09
0
110
WantedlyでのKotlin Multiplatformの導入と課題 / Kotlin Multiplatform Implementation and Challenges at Wantedly
kubode
0
250
comilioとCloudflare、そして未来へと向けて
oliver_diary
6
440
When Windows Meets Kubernetes…
pichuang
0
300
FODにおけるホーム画面編成のレコメンド
watarukudo
PRO
2
280
機械学習を「社会実装」するということ 2025年版 / Social Implementation of Machine Learning 2025 Version
moepy_stats
5
1.1k
Copilotの力を実感!3ヶ月間の生成AI研修の試行錯誤&成功事例をご紹介。果たして得たものとは・・?
ktc_shiori
0
350
Featured
See All Featured
Statistics for Hackers
jakevdp
797
220k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The Cost Of JavaScript in 2023
addyosmani
46
7.2k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
960
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.2k
Raft: Consensus for Rubyists
vanstee
137
6.7k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Navigating Team Friction
lara
183
15k
GraphQLとの向き合い方2022年版
quramy
44
13k
A Tale of Four Properties
chriscoyier
157
23k
Producing Creativity
orderedlist
PRO
343
39k
Transcript
None
None
【目的】 典型的な確率的最適化手法 など で必要とされる、 やその他のパラメータの調整を不必要にする事。 【 】 • • •
• •
エキスパート統合問題 問題設定 • 東京ドームで行われたあるクイズ大会に参加 • 制限時間内に答えだと思った方向に移動する ◯ 外野側、✕ 内野側 •
◯✕クイズが 問出題され、成績上位者が2次予選に進める 問題が分からなくても優勝経験のある 人を発見して、同じ動きをすれば良い ◦ 正解率が高いはずの優勝経験のある人をエキスパートと呼ぶ事にする ◦ 人のエキスパートと問題出題者をまとめて環境と呼ぶ事にする 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 環境がプレイヤーのアルゴリズム を知った上で、予測 ・ となるクイズを出題する ような、最悪の場合の解析を行う手法 この手法から を求める事が多い? 畑埜晃平,
& 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 • 素朴な戦略 の真似をする
◦ ミスの回数 たかだか 回 • 分法 の多数決に従う ◦ ミスの回数 たかだか • 乱択 分法 から 様ランダムに 人選び、その決定に従う ◦ ミスの回数 たかだか 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在しない場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社. アルゴリズム の 誤り回数の期待値 エキスパートの 誤り回数の最小値
エキスパート統合問題 乱択2分法 再掲 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 別の問題設定 オンライン配分問題 複数の投資先の銘柄 あるいはアルゴリズムやサーバ等選択肢 が与えられたとき、 持っている資源をうまく配分する事で損失を最小化する問題を考える 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 エキスパートの予測集合の扱い • エキスパート統合問題 ◦ 乱択2分法の変更 重み付き平均アルゴリズム ▪ 単純な問題として定式化 •
どんなエキスパート統合問題 も確率ベクトル集合を予測集合とし、各エキスパート は常 に単位ベクトルを予測するものに限定した問題に還元できる 標準化 • 標準化したオンライン配分問題に対する を ヘッジアルゴリズム と呼ぶ • エキスパートの予測を単位ベクトルではなく、一般化して凸集合であるとした枠組み をオンライン凸最適化 と呼ぶ
エキスパート統合問題 エキスパート統合問題 標準形 ↪ 一般化 オンライン凸最適化問題 予測値集合 凸集合 ↪ 特殊ケース
オンライン線形最適化問題
論文 • ◦ ◦ 基準 をベースにした 推定量を用いて、 なオンライン最適化 手法の提案 他の論文解説はこちら
https://github.com/CompML/survey-stochastic-optimization/issues