Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データマイニング - グラフ構造の諸指標
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Y. Yamamoto
PRO
June 20, 2025
Science
310
0
Share
データマイニング - グラフ構造の諸指標
1. グラフの大きさ
2. 密度
3. 連結性
4. 次数の分布
Y. Yamamoto
PRO
June 20, 2025
More Decks by Y. Yamamoto
See All by Y. Yamamoto
データベース05: SQL(2/3) 結合質問
trycycle
PRO
0
990
機械学習 - DBSCAN
trycycle
PRO
0
1.7k
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
1.3k
機械学習 - K-means & 階層的クラスタリング
trycycle
PRO
0
1.5k
データベース03: 関係データモデル
trycycle
PRO
1
500
機械学習 - 決定木からはじめる機械学習
trycycle
PRO
0
1.4k
データベース02: データベースの概念
trycycle
PRO
2
1.1k
機械学習 - pandas入門
trycycle
PRO
0
580
データベース01: データベースを使わない世界
trycycle
PRO
1
1.2k
Other Decks in Science
See All in Science
Testing the Longevity Bottleneck Hypothesis
chinson03
0
280
アクシズを探せ! 各勢力の位置関係についての考察
miu_crescent
PRO
1
280
(2025) Balade en cyclotomie
mansuy
0
560
Accelerating operator Sinkhorn iteration with overrelaxation
tasusu
0
320
Kaggle: NeurIPS - Open Polymer Prediction 2025 コンペ 反省会
calpis10000
0
550
ITTF卓球世界ランキングのポイント比を用いた試合結果予測モデルの性能評価 / Performance evaluation of match result prediction models using the point ratio of the ITTF Table Tennis World Ranking
konakalab
0
120
次代のデータサイエンティストへ~スキルチェックリスト、タスクリスト更新~
datascientistsociety
PRO
3
40k
主成分分析に基づく教師なし特徴抽出法を用いたコラーゲン-グリコサミノグリカンメッシュの遺伝子発現への影響
tagtag
PRO
0
250
ド文系だった私が、 KaggleのNCAAコンペでソロ金取れるまで
wakamatsu_takumu
2
2.3k
AIに仕事を奪われる 最初の医師たちへ
ikora128
0
1.1k
Amusing Abliteration
ianozsvald
1
170
Vibecoding for Product Managers
ibknadedeji
0
160
Featured
See All Featured
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
150
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
550
Heart Work Chapter 1 - Part 1
lfama
PRO
7
35k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.2k
Faster Mobile Websites
deanohume
310
31k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.4k
Designing Experiences People Love
moore
143
24k
Fireside Chat
paigeccino
42
3.9k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
Music & Morning Musume
bryan
47
7.2k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Marketing to machines
jonoalderson
1
5.3k
Transcript
グラフ構造の諸指標 ⼭本 祐輔 名古屋市⽴⼤学 データサイエンス研究科
[email protected]
第10回 データマイニング (グラフ分析入門) ⼭本祐輔
クリエイティブコモンズライセンス (CC BY-NC-SA 4.0)
グラフを「把握したい」ケース グラフを把握したい ノード 単体 グラフの 部分構造 グラフ 全体
グラフを「把握したい」ケース グラフを把握したい ノード 単体 グラフの 部分構造 グラフ 全体 ノードの 重要度評価
コミュニティや 特徴的な経路の発⾒ 局所的特徴 ⼤局的特徴
グラフを「把握したい」ケース グラフを把握したい グラフ 全体 ノードの 重要度評価 コミュニティや 特徴的な経路の発⾒ 局所的特徴 ⼤局的特徴
はじめにグラフ全体の特徴を理解することは重要 ノード 単体 グラフの 部分構造
グラフの⼤きさを⽰す指標: ノード数 グラフに含まれるノードの数 1 0 2 3 4 5 |
V | = 6 # NetworkXを使う場合 V = G.nodes() len(V) # 以下でもOK G.number_of_nodes()
グラフの⼤きさを⽰す指標: 直径 (diameter) グラフに属するノード間の距離の最大値 1 0 2 3 4 5
(最も離れているノード同⼠の距離) 1 0 4 2 3 5 d = 3 d = 1
グラフの⼤きさを⽰す指標: 直径 (diameter) d = ? グラフに属するノード間の距離の最大値 (最も離れているノード同⼠の距離) 1 0
4 2 3 5
グラフの⼤きさを⽰す指標: 直径 (diameter) d = 3 グラフに属するノード間の距離の最大値 (最も離れているノード同⼠の距離) 1 0
4 2 3 5 # NetworkXを使う場合 nx.diameter(G)
余談: 離⼼数 (eccentricity) 注目ノードから他ノードへの距離の最大値 1 0 2 3 4 5
ノード0の離⼼数 = 3 1 0 2 3 4 5 ノード2の離⼼数 = 2 グラフの直径とは「グラフ中のノード離心数の最大値」
グラフの⼤きさを⽰す指標: 半径 (radius) グラフに属するノードの離心数の最小値 1 0 2 3 4 5
1 0 4 2 3 5 半径r = 2 r = 1 (直径d = 3) (直径d = 1)
グラフの⼤きさを⽰す指標: 半径 (radius) r = ? 1 0 4 2
3 5 グラフに属するノードの離心数の最小値
グラフの⼤きさを⽰す指標: 半径 (radius) r = 3 グラフに属するノードの離心数の最小値 1 0 4
2 3 5 # NetworkXを使う場合 nx.radius(G)
グラフの密度 (density) グラフ中のノード間に張ることのできる すべての辺に対する、実際の辺の数の割合 1 0 2 3 4 5
ノード集合をV、 エッジ集合をEとすると = | E | | V | C2 密度 密度 = ! "#$ nx.density(G) # NetworkXを使う場合
グラフの密度 (density) グラフ中のノード間に張ることのできる すべての辺に対する、実際の辺の数の割合 密度 = ! !"# = 0.4
1 0 4 2 3 5 1 0 4 2 3 5 密度 = 1
完全グラフ(complete graph) グラフ中の全ノード間にエッジが張られている グラフを完全グラフと呼ぶ 1 0 4 2 3 5
密度 = 1
連結性 グラフ中の任意のノード間に経路が存在する とき、そのグラフは「連結グラフ」という 1 0 4 2 3 5 連結グラフ
1 0 4 2 3 5 ⾮連結グラフ
連結性 グラフ中の任意のノード間に経路が存在する とき、そのグラフは「連結グラフ」という 1 0 4 2 3 5 連結グラフ
nx.is_connected(G) # NetworkXを使う場合 # 左のグラフにはTrueを返す
強連結 有向グラフ中の任意のノード間に有向経路が 存在するとき、そのグラフは「強連結」である 1 0 4 2 3 5 強連結である
1 0 4 2 3 5 強連結でない
強連結 有向グラフ中の任意のノード間に有向経路が 存在するとき、そのグラフは「強連結」である 1 0 4 2 3 5 強連結である
nx.is_strongly_connected(G) # NetworkXを使う場合 # 左のグラフにはTrueを返す
次数分布 次数 (degree) ノードに接続しているエッジの数 次数分布 § グラフに属するノードの次数の分布 § ⼤きさや密度が同じでも次数分布が異なることもある 1
0 2 3 4 ノード2の次数 = 3 ノード4の次数 = 1
次数分布 次数 (degree) ノードに接続しているエッジの数 次数分布 § グラフに属するノードの次数の分布 § ⼤きさや密度が同じでも次数分布が異なることもある 1
0 2 3 4 G.degree[2] # NetworkXを使う場合 # ノード2の次数(=3)を返す
同じノード数,密度を持つのに次数分布が異なるグラフの例
Hands-on タイム 以下のURLにアクセスして, 第10回のクイズを解いてみよう https://graphnote.hontolab.org/ 23
回 実施日 トピック 9 06/13 グラフデータ 10 06/20 グラフ構造の諸指標 11
06/27 ノードの中心性 12 07/04 コミュニティ発見 13 07/11 ウェブグラフ 14 07/18 グラフ埋め込み 15 07/25 総合演習 – 社会ネットワーク分析 授業計画 24