Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIPS 2011 勉強会 (Information Diffusion)
Search
@smly
April 08, 2012
2
2.7k
NIPS 2011 勉強会 (Information Diffusion)
NIPS 2011 勉強会 (
http://chouseisan.com/schedule/List?h=cc568b40d9d6c20e02222e320c608810
) での論文紹介スライドです
@smly
April 08, 2012
Tweet
Share
More Decks by @smly
See All by @smly
IMC の細かすぎる話 2025
smly
2
820
(Recognition) Large-scale Landmark Retrieval/Recognition under a Noisy and Diverse Dataset
smly
1
490
(Retrieval) Large-scale Landmark Retrieval/Recognition under a Noisy and Diverse Dataset
smly
2
11k
画像検索 (特定物体認識) — 古典手法、マッチング、深層学習、Kaggle
smly
24
7.9k
データ分析コンテストの 勝者解答から学ぶ
smly
46
19k
データ分析コンテストの技術と最近の進展
smly
25
9k
Python とデータ分析コンテストの実践
smly
15
8.9k
実験の再現性と効率化の話(Docker と Serialization 周辺)
smly
5
3.3k
Workflow, Serialization & Docker for Kaggle
smly
10
2.8k
Featured
See All Featured
The Pragmatic Product Professional
lauravandoore
37
7.1k
SEO for Brand Visibility & Recognition
aleyda
0
4.1k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
99
Crafting Experiences
bethany
0
25
End of SEO as We Know It (SMX Advanced Version)
ipullrank
2
3.8k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
140
The Limits of Empathy - UXLibs8
cassininazir
1
200
Digital Ethics as a Driver of Design Innovation
axbom
PRO
0
140
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
1
220
Docker and Python
trallard
47
3.7k
Ruling the World: When Life Gets Gamed
codingconduct
0
120
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Transcript
勉強会 紹介論文
今日読むもの Reconstructing Patterns of Information Diffusion from Incomplete Observations –
By Flavio Chierichetti, Jon Kleinberg, David Liben-Nowell オンライン上で広まっている情報の伝染を調べる話 情報の広がりを木として扱い、全体は観測できないが 部分的なパスをいくつか観測できるケースを考える ⇒ 部分的な観測から構築した木の性質を調べる ⇒ 元の木のサイズを推定する (※ Rights to all the images belong to their respective owners)
情報伝染の木構造の構築 [Liben-Nowell & Klenberg 2008] と同様、嘆願書(名前を連 ねてコピーメールを転送するチェーンメール)の広がりの パターンを木としてモデル化 一部の人が公開した署名リストから木を作る 何度受け取ったとしてもコピーするのは一度だけと仮定
http://petitions.cs.cornell.edu/
部分的に観測する木を で扱う • 各ノードは Root までのパスを確率 δ > 0 で晒す
– 観測されたパスにより部分木 T’ ⊆ T を構築 • 木 T から δ-sampling によりできる木の全体を T_δ 確率δで晒す
None
糸っぽい… 不思議
観測したパスから再構築した木 T’ はとても糸のような奇 妙な木 (94% が single child node) 1.
どうしてこのような糸っぽい木になったのか δ-sampling と single child fraction の関係を形式的に調べる 2. オリジナルの木 T のサイズ(ノード数)を推定したい T’ T
観測したパスから再構築した木 T’ はとても糸のような奇 妙な木 (94% が single child node) 1.
どうしてこのような糸っぽい木になったのか δ-sampling と single child fraction の関係を形式的に調べる 2. オリジナルの木 T のサイズ(ノード数)を推定したい T’ T 1. δ-sampling した木 Tδ に対してδ→ 0 としたとき Single Child fraction が 1 に収束することを証明 2. δの普遍推定量を導出してオリジナルの木のサイズ n 推定
① [Golub & Jackson 2010] Galton-Watson branching process でシュミレーションして single
child fraction が大きくなることを示した [Chierichetti+ 2011] (this paper) Bounded-degree tree を仮定して, 小さい δ で δ-sampling すると single child fraction が大きくなることを示した 結果 (this paper) • となるような関数 を考える • T は最大 k の子ノードを持つとする (degree bounded) • の single child fraction は
• |T| = n, max(deg) = k • 木のノードを3つのタイプに分ける –
branching node (1人以上の子持ち) – Leave – Single child node • 内の葉がすべて expose した node するケース を考えると の leave の数は大きくても δn • Branching node は O(δn) … max(deg) = k • Leave と branching node の他は single child node 互いを制約する
• Leave … O(δn) / Branching node … O(δn) •
[Th2.1] のノード数は高い確率で – のサイズは O(δn) を超えるので single-child node の割合は →
② 元の木のサイズを推定をする V = V(Tδ) L ⊆ V … set
of its leaves E ⊆ V ... set of its nodes that were exposed |V – L| … leave 以外. 大きいと縦長 大きくなるとδ小さくなり糸っぽい (①) ¥hat{δ} は普遍推定量となる (Lemma 3.1)
Iraq-War protest chain 18,119 signers → approximately 173,000 signers
(あとで Full version 読んで証明を加えてスライド Update します…) • 実世界で観測された木の奇妙な特徴(糸っぽい 木)に対する数学的な説明を与えた •
観測された木を未知の木(オリジナル)の性質 を予測するために使った • 実世界の chain letter のデータセットではじめて signer の数を推定した