Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GDS入門
Search
Takehana
April 19, 2021
Programming
0
1.8k
GDS入門
Takehana
April 19, 2021
Tweet
Share
Other Decks in Programming
See All in Programming
LLM Observabilityによる 対話型音声AIアプリケーションの安定運用
gekko0114
2
420
CSC307 Lecture 05
javiergs
PRO
0
500
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
530
カスタマーサクセス業務を変革したヘルススコアの実現と学び
_hummer0724
0
680
Spinner 軸ズレ現象を調べたらレンダリング深淵に飲まれた #レバテックMeetup
bengo4com
1
230
疑似コードによるプロンプト記述、どのくらい正確に実行される?
kokuyouwind
0
380
AI巻き込み型コードレビューのススメ
nealle
1
150
CSC307 Lecture 01
javiergs
PRO
0
690
Grafana:建立系統全知視角的捷徑
blueswen
0
330
dchart: charts from deck markup
ajstarks
3
990
CSC307 Lecture 07
javiergs
PRO
0
550
ぼくの開発環境2026
yuzneri
0
180
Featured
See All Featured
Paper Plane (Part 1)
katiecoart
PRO
0
4k
Making Projects Easy
brettharned
120
6.6k
Un-Boring Meetings
codingconduct
0
200
The Curious Case for Waylosing
cassininazir
0
230
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
My Coaching Mixtape
mlcsv
0
47
How to make the Groovebox
asonas
2
1.9k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
First, design no harm
axbom
PRO
2
1.1k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
210
Transcript
GDS入門 1
今日の内容 • 自己紹介 • Graph Datascience Libraryの概要紹介 • neo4j sandboxでの実例紹介
2
自己紹介 名前:竹花洋明 所属:クリエーションライン 前職:IoT関連 現在:クラウド(GCP)、Terraform、DBサポート・PoC(neo4j, mongodb) 3
Graph Data Science Libraryとは? • グラフアルゴリズムをCypher経由で実行できるライブラリ • neo4j database上のデータではなく、in-memory graph形式のデータに対して実行
• 無料のCommunity版と有料のEnterprise版があり、Enterprise版だと以下のような 特徴がある ◦ CPU Core数が無制限 ◦ RBACをサポート ◦ model catalogのいくつかの機能が追加で使用可能 ◦ optimized in-memory graph implementationが使用可能 4
グラフアルゴリズムとは • グラフに対するアルゴリズムで、いくつかの種類に分けられるので次のスライドから はそちらを紹介します • GDS内では成熟度(maturity)により、以下3種類に分けられます ◦ Production-quality ◦ Beta
◦ Alpha 5
Centrality algorithms relationshipの数や向き、hop数等を用いて各ノードをスコア化する。 (影響力の高い人物の検出等に利用 ) GDSで使用可能な主なアルゴリズム: PageRank、Closeness Centrality、Degree Centrality https://neo4j.com/docs/graph-data-science/current/algorithms/page-rank/#algorithms-page-rank
6
Community Detection algorithms 各ノードのrelationshipに基づき、グループに割り当てる (コミュニティ検出等に利用 ) GDSで使用可能な主なアルゴリズム: Louvain、Label Propagation、Weakly Connected
Components https://neo4j.com/docs/graph-data-science/current/algorithms/label-propagation/#algorithms-label-propagation 7
Similarity algorithms ノード間の近似性をスコア化する (recommendation等に利用) GDSで使用可能な主なアルゴリズム: Node Similarity、K-Nearest Neighbors、Jaccard Similarity https://neo4j.com/docs/graph-data-science/current/algorithms/node-similarity/#algorithms-node-similarity
8
その他 • Path finding algorithms • Link Prediction algorithms •
Node embeddings • Machine Learning Models • Auxiliary procedures • Pregel API 9
GDSの内部動作 https://neo4j.com/docs/graph-data-science/current/common-usage/ 10
実例紹介 • neo4j sandbox・・・Webブラウザのみでneo4jの機能や、データセットを元にしたシ ナリオを通してneo4jの学習ができる • 今回は金融系のデータから怪しいアカウントを検出する「Fraud Detection」を実施 します。 11
Fraud Detectionの概要 個人情報を偽装や盗みだしたものを使用している想定。 特徴として複数の人が同じ個人情報を使用している場合が多いので、今回はこれを元 に詐欺を検出する。 Person Person Phone 12
特定の流れ Person Person Phone Person Person Phone Email Email Person
Person Phone Person Person Person Person 1.個人情報を共有している人を 特定しグループ化する 2.共有している個人情報の被り 具合を元に、Similarity(近似 性)をスコア化する 3.1と2を元にグループ内での Similarityから詐欺スコアを算 出する 13
WCC(重みなし) A C B D E 14
WCC(重みなし) A C B D E GroupID:1 GroupID:1 GroupID:1 GroupID:2
GroupID:2 15
WCC(重みあり) A C B D E weight:0.5 weight:1 weight:1 16
WCC(重みあり) A C B D E GroupID:1 GroupID:3 GroupID:1 GroupID:2
GroupID:2 weight:0.5 weight:1 weight:1 17