Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
WSDM 2016勉強会資料
Search
Shinichi Takayanagi
March 17, 2016
Research
1
1.2k
WSDM 2016勉強会資料
「WSDM 2016勉強会」(
https://atnd.org/events/74341)の担当箇所資料
。
Shinichi Takayanagi
March 17, 2016
Tweet
Share
More Decks by Shinichi Takayanagi
See All by Shinichi Takayanagi
論文紹介「Evaluation gaps in machine learning practice」と、効果検証入門に関する昔話
stakaya
0
1k
バイブコーディングの正体——AIエージェントはソフトウェア開発を変えるか?
stakaya
5
1.5k
[NeurIPS 2023 論文読み会] Wasserstein Quantum Monte Carlo
stakaya
0
570
[KDD2021 論文読み会] ControlBurn: Feature Selection by Sparse Forests
stakaya
2
2k
[ICML2021 論文読み会] Mandoline: Model Evaluation under Distribution Shift
stakaya
0
2k
[情報検索/推薦 各社合同 論文読み祭 #1] KDD ‘20 "Embedding-based Retrieval in Facebook Search"
stakaya
2
650
【2020年新人研修資料】ナウでヤングなPython開発入門
stakaya
29
21k
論文読んだ「Simple and Deterministic Matrix Sketching」
stakaya
1
1.2k
Quick Introduction to Approximate Bayesian Computation (ABC) with R"
stakaya
3
370
Other Decks in Research
See All in Research
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp
1
450
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
550
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
6
3.2k
OWASP KansaiDAY 2025.09_文系OSINTハンズオン
owaspkansai
0
110
LiDARセキュリティ最前線(2025年)
kentaroy47
0
140
生成AI による論文執筆サポート・ワークショップ 論文執筆・推敲編 / Generative AI-Assisted Paper Writing Support Workshop: Drafting and Revision Edition
ks91
PRO
0
120
Earth AI: Unlocking Geospatial Insights with Foundation Models and Cross-Modal Reasoning
satai
3
490
自動運転におけるデータ駆動型AIに対する安全性の考え方 / Safety Engineering for Data-Driven AI in Autonomous Driving Systems
ishikawafyu
0
130
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
37k
それ、チームの改善になってますか?ー「チームとは?」から始めた組織の実験ー
hirakawa51
0
670
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
15
20k
Proposal of an Information Delivery Method for Electronic Paper Signage Using Human Mobility as the Communication Medium / ICCE-Asia 2025
yumulab
0
170
Featured
See All Featured
Evolving SEO for Evolving Search Engines
ryanjones
0
130
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
330
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
94
Believing is Seeing
oripsolob
1
58
Color Theory Basics | Prateek | Gurzu
gurzu
0
200
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
430
Site-Speed That Sticks
csswizardry
13
1.1k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
270
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
79
How to Ace a Technical Interview
jacobian
281
24k
Skip the Path - Find Your Career Trail
mkilby
0
59
Transcript
WSDM 2016勉強会 「Wiggins: Detecting Valuable Information in Dynamic Networks Using
Limited Resources」 Ahmad Mahmoody, Matteo Riondato, Eli Upfal 株式会社リクルートコミュニケーションズ ICTソリューション局アドテクノロジーサービス開発部 高柳慎一
モチベーション • 動的ネットワーク上での情報検知は有用 – 新しいWebページの検出 – 電気回路上での欠陥の伝搬 – 水の汚染の検出 •
情報がネットワーク上を伝搬していく • 情報を新規性のあるうちに見つけたい • 一方、全ノードを常に監視するのは難しい – 各時点において一部のノードを調査できる状況を考える • どうノードを調査すべきかの最適なスケジューリン グを考えたい 2
やったこと • 各種定義 – ネットワーク上での情報の生成と伝搬過程の定式化 • (明示的に書いてないけど)測度論ベース – スケジュールに沿ったノードの調査法の定義 –
異なるスケジュール間のコストを定義 • これらを最適調査計画問題(Optimal Probing Schedule Problem)として定義づける • 制約付の凸計画問題として定式化し、それを解くた めにWIGGINSというアルゴリズム提案 – MapReduce適用な形で提案 – WIGGINSってのはシャーロックホームズに出てくる諜報 機関?のリーダの名前らしい 3
2:問題の定式化 • グラフ構造: • ノード数: • ノードの部分集合族: • ある関数(確率): :
→ • グラフ上での情報生成・伝搬過程: – 時点tにおいて生成される情報(集合族): – あるノード部分集合 が に含まれる確率 • Sは論文中ではσ加法族と区別するために導入 – 単なるVの部分集合と考える、かつ、その生起確率を定義 • (t, S): “時点tに生成された情報が 手元にある る”を表現(アイテムと呼称) 4
2:問題の定式化 • “時点tにおいて調査する” =アイテム集合を得る • 過去に生成された情報の和集合: • 全時点ではc個のノードのみを調べる • :時点tより以前に取得
• :時点tにおいてまだここにない • 情報の新規性: • まだ見ぬ情報集合 によるLoad 5
• スケジュールpはノードV上の確率分布 • 時点tにおいてc個のうち 個ノードを選択 • コスト関数を定義(スケジュールpに依存!) • これを解く: (θ,
c)-OPSP – (θ, c)-Optimal Probing Schedule Problem – スケジュール集合: 6 2:問題の定式化
3: 関連研究 • 水汚染の検出[1, 13, 20, 24, 29] • 伝染病の検出[7]
• センサーのバッテリー消費最適化[11, 19, 21, 22] • SNS上での急伸トピックの検出[4, 25] • クローリング [8, 32] • ニュースフィードの更新[3, 15, 28, 30] 7
4:WIGGINSアルゴリズム • が既知の場合 • は凸関数 • 拘束条件付きの最適化問題として以下を解く 8
4:WIGGINSアルゴリズム 9
• 限られた(離散的な)情報しかわからない場合 • アルゴリズムはこの部分だけを変更する • Sごとにmapして計算(mapReduce) 10 4:WIGGINSアルゴリズム
5:数値実験 • Independent-Cascade (IC) model [17]を使用 • 生成(creation)フェイズ – ノード上に噂”rumor”を生成し、そのノードの出次数
(出 て行く辺数、outdegree, deg+)に応じて確率にbiasを付 けて生成を行わせる • 伝搬(diffusion)フェイズ – 確率1/伝搬先の入次数(入ってくる辺数indegree, deg-) で伝搬 11
• 他のベンチマーク的な方法 – 一様、out or indegree・接続数に比例で選択 • これらに比べてコスト関数が小さくなる 12 5:数値実験
• 一度最適化したもの に負荷を与える(灰 色箇所始端からノー ドの値をランダムに ひっくり返す) • 緑色箇所にてまた最 適化計算 13
5:数値実験
• ノイズの影響がまた消える 14 5:数値実験
まとめ • ネットワーク上での情報の生成と伝搬過程の定式化 • (明示的に書いてないけど)測度論ベース – スケジュールに沿ったノードの調査法の定義 – 異なるスケジュール間のコストを定義 •
これらを最適調査計画問題(Optimal Probing Schedule Problem)として定式化 • 制約付の凸計画問題として定式化し、それを解くた めにWIGGINSというアルゴリズム提案 • 数値検証実施 15