Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GDS入門
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Takehana
April 19, 2021
Programming
0
1.8k
GDS入門
Takehana
April 19, 2021
Tweet
Share
Other Decks in Programming
See All in Programming
MDN Web Docs に日本語翻訳でコントリビュート
ohmori_yusuke
0
650
Data-Centric Kaggle
isax1015
2
770
AIエージェントのキホンから学ぶ「エージェンティックコーディング」実践入門
masahiro_nishimi
5
410
Fragmented Architectures
denyspoltorak
0
150
AgentCoreとHuman in the Loop
har1101
5
230
0→1 フロントエンド開発 Tips🚀 #レバテックMeetup
bengo4com
0
560
AI巻き込み型コードレビューのススメ
nealle
1
160
360° Signals in Angular: Signal Forms with SignalStore & Resources @ngLondon 01/2026
manfredsteyer
PRO
0
120
そのAIレビュー、レビューしてますか? / Are you reviewing those AI reviews?
rkaga
6
4.5k
CSC307 Lecture 06
javiergs
PRO
0
680
2026年 エンジニアリング自己学習法
yumechi
0
130
責任感のあるCloudWatchアラームを設計しよう
akihisaikeda
3
170
Featured
See All Featured
Paper Plane (Part 1)
katiecoart
PRO
0
4.1k
Optimizing for Happiness
mojombo
379
71k
Odyssey Design
rkendrick25
PRO
1
490
30 Presentation Tips
portentint
PRO
1
210
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
73
Practical Orchestrator
shlominoach
191
11k
Designing Powerful Visuals for Engaging Learning
tmiket
0
230
Why Our Code Smells
bkeepers
PRO
340
58k
Deep Space Network (abreviated)
tonyrice
0
47
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
49k
YesSQL, Process and Tooling at Scale
rocio
174
15k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3k
Transcript
GDS入門 1
今日の内容 • 自己紹介 • Graph Datascience Libraryの概要紹介 • neo4j sandboxでの実例紹介
2
自己紹介 名前:竹花洋明 所属:クリエーションライン 前職:IoT関連 現在:クラウド(GCP)、Terraform、DBサポート・PoC(neo4j, mongodb) 3
Graph Data Science Libraryとは? • グラフアルゴリズムをCypher経由で実行できるライブラリ • neo4j database上のデータではなく、in-memory graph形式のデータに対して実行
• 無料のCommunity版と有料のEnterprise版があり、Enterprise版だと以下のような 特徴がある ◦ CPU Core数が無制限 ◦ RBACをサポート ◦ model catalogのいくつかの機能が追加で使用可能 ◦ optimized in-memory graph implementationが使用可能 4
グラフアルゴリズムとは • グラフに対するアルゴリズムで、いくつかの種類に分けられるので次のスライドから はそちらを紹介します • GDS内では成熟度(maturity)により、以下3種類に分けられます ◦ Production-quality ◦ Beta
◦ Alpha 5
Centrality algorithms relationshipの数や向き、hop数等を用いて各ノードをスコア化する。 (影響力の高い人物の検出等に利用 ) GDSで使用可能な主なアルゴリズム: PageRank、Closeness Centrality、Degree Centrality https://neo4j.com/docs/graph-data-science/current/algorithms/page-rank/#algorithms-page-rank
6
Community Detection algorithms 各ノードのrelationshipに基づき、グループに割り当てる (コミュニティ検出等に利用 ) GDSで使用可能な主なアルゴリズム: Louvain、Label Propagation、Weakly Connected
Components https://neo4j.com/docs/graph-data-science/current/algorithms/label-propagation/#algorithms-label-propagation 7
Similarity algorithms ノード間の近似性をスコア化する (recommendation等に利用) GDSで使用可能な主なアルゴリズム: Node Similarity、K-Nearest Neighbors、Jaccard Similarity https://neo4j.com/docs/graph-data-science/current/algorithms/node-similarity/#algorithms-node-similarity
8
その他 • Path finding algorithms • Link Prediction algorithms •
Node embeddings • Machine Learning Models • Auxiliary procedures • Pregel API 9
GDSの内部動作 https://neo4j.com/docs/graph-data-science/current/common-usage/ 10
実例紹介 • neo4j sandbox・・・Webブラウザのみでneo4jの機能や、データセットを元にしたシ ナリオを通してneo4jの学習ができる • 今回は金融系のデータから怪しいアカウントを検出する「Fraud Detection」を実施 します。 11
Fraud Detectionの概要 個人情報を偽装や盗みだしたものを使用している想定。 特徴として複数の人が同じ個人情報を使用している場合が多いので、今回はこれを元 に詐欺を検出する。 Person Person Phone 12
特定の流れ Person Person Phone Person Person Phone Email Email Person
Person Phone Person Person Person Person 1.個人情報を共有している人を 特定しグループ化する 2.共有している個人情報の被り 具合を元に、Similarity(近似 性)をスコア化する 3.1と2を元にグループ内での Similarityから詐欺スコアを算 出する 13
WCC(重みなし) A C B D E 14
WCC(重みなし) A C B D E GroupID:1 GroupID:1 GroupID:1 GroupID:2
GroupID:2 15
WCC(重みあり) A C B D E weight:0.5 weight:1 weight:1 16
WCC(重みあり) A C B D E GroupID:1 GroupID:3 GroupID:1 GroupID:2
GroupID:2 weight:0.5 weight:1 weight:1 17