Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GDS入門
Search
Takehana
April 19, 2021
Programming
0
1.8k
GDS入門
Takehana
April 19, 2021
Tweet
Share
Other Decks in Programming
See All in Programming
なるべく楽してバックエンドに型をつけたい!(楽とは言ってない)
hibiki_cube
0
140
CSC307 Lecture 02
javiergs
PRO
1
780
Data-Centric Kaggle
isax1015
2
770
例外処理とどう使い分ける?Result型を使ったエラー設計 #burikaigi
kajitack
16
6k
コマンドとリード間の連携に対する脅威分析フレームワーク
pandayumi
1
450
Automatic Grammar Agreementと Markdown Extended Attributes について
kishikawakatsumi
0
180
AI時代の認知負荷との向き合い方
optfit
0
160
Oxlintはいいぞ
yug1224
5
1.3k
Amazon Bedrockを活用したRAGの品質管理パイプライン構築
tosuri13
4
320
QAフローを最適化し、品質水準を満たしながらリリースまでの期間を最短化する #RSGT2026
shibayu36
2
4.4k
OSSとなったswift-buildで Xcodeのビルドを差し替えられるため 自分でXcodeを直せる時代になっている ダイアモンド問題編
yimajo
3
610
React 19でつくる「気持ちいいUI」- 楽観的UIのすすめ
himorishige
11
7.4k
Featured
See All Featured
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
220
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
54
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
0
140
Chasing Engaging Ingredients in Design
codingconduct
0
110
Become a Pro
speakerdeck
PRO
31
5.8k
エンジニアに許された特別な時間の終わり
watany
106
230k
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
0
1.9k
Designing for Performance
lara
610
70k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
140
Transcript
GDS入門 1
今日の内容 • 自己紹介 • Graph Datascience Libraryの概要紹介 • neo4j sandboxでの実例紹介
2
自己紹介 名前:竹花洋明 所属:クリエーションライン 前職:IoT関連 現在:クラウド(GCP)、Terraform、DBサポート・PoC(neo4j, mongodb) 3
Graph Data Science Libraryとは? • グラフアルゴリズムをCypher経由で実行できるライブラリ • neo4j database上のデータではなく、in-memory graph形式のデータに対して実行
• 無料のCommunity版と有料のEnterprise版があり、Enterprise版だと以下のような 特徴がある ◦ CPU Core数が無制限 ◦ RBACをサポート ◦ model catalogのいくつかの機能が追加で使用可能 ◦ optimized in-memory graph implementationが使用可能 4
グラフアルゴリズムとは • グラフに対するアルゴリズムで、いくつかの種類に分けられるので次のスライドから はそちらを紹介します • GDS内では成熟度(maturity)により、以下3種類に分けられます ◦ Production-quality ◦ Beta
◦ Alpha 5
Centrality algorithms relationshipの数や向き、hop数等を用いて各ノードをスコア化する。 (影響力の高い人物の検出等に利用 ) GDSで使用可能な主なアルゴリズム: PageRank、Closeness Centrality、Degree Centrality https://neo4j.com/docs/graph-data-science/current/algorithms/page-rank/#algorithms-page-rank
6
Community Detection algorithms 各ノードのrelationshipに基づき、グループに割り当てる (コミュニティ検出等に利用 ) GDSで使用可能な主なアルゴリズム: Louvain、Label Propagation、Weakly Connected
Components https://neo4j.com/docs/graph-data-science/current/algorithms/label-propagation/#algorithms-label-propagation 7
Similarity algorithms ノード間の近似性をスコア化する (recommendation等に利用) GDSで使用可能な主なアルゴリズム: Node Similarity、K-Nearest Neighbors、Jaccard Similarity https://neo4j.com/docs/graph-data-science/current/algorithms/node-similarity/#algorithms-node-similarity
8
その他 • Path finding algorithms • Link Prediction algorithms •
Node embeddings • Machine Learning Models • Auxiliary procedures • Pregel API 9
GDSの内部動作 https://neo4j.com/docs/graph-data-science/current/common-usage/ 10
実例紹介 • neo4j sandbox・・・Webブラウザのみでneo4jの機能や、データセットを元にしたシ ナリオを通してneo4jの学習ができる • 今回は金融系のデータから怪しいアカウントを検出する「Fraud Detection」を実施 します。 11
Fraud Detectionの概要 個人情報を偽装や盗みだしたものを使用している想定。 特徴として複数の人が同じ個人情報を使用している場合が多いので、今回はこれを元 に詐欺を検出する。 Person Person Phone 12
特定の流れ Person Person Phone Person Person Phone Email Email Person
Person Phone Person Person Person Person 1.個人情報を共有している人を 特定しグループ化する 2.共有している個人情報の被り 具合を元に、Similarity(近似 性)をスコア化する 3.1と2を元にグループ内での Similarityから詐欺スコアを算 出する 13
WCC(重みなし) A C B D E 14
WCC(重みなし) A C B D E GroupID:1 GroupID:1 GroupID:1 GroupID:2
GroupID:2 15
WCC(重みあり) A C B D E weight:0.5 weight:1 weight:1 16
WCC(重みあり) A C B D E GroupID:1 GroupID:3 GroupID:1 GroupID:2
GroupID:2 weight:0.5 weight:1 weight:1 17