Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GDS入門
Search
Takehana
April 19, 2021
Programming
0
1.8k
GDS入門
Takehana
April 19, 2021
Tweet
Share
Other Decks in Programming
See All in Programming
Developing static sites with Ruby
okuramasafumi
0
250
【Streamlit x Snowflake】データ基盤からアプリ開発・AI活用まで、すべてをSnowflake内で実現
ayumu_yamaguchi
1
120
MAP, Jigsaw, Code Golf 振り返り会 by 関東Kaggler会|Jigsaw 15th Solution
hasibirok0
0
230
251126 TestState APIってなんだっけ?Step Functionsテストどう変わる?
east_takumi
0
310
FluorTracer / RayTracingCamp11
kugimasa
0
220
エディターってAIで操作できるんだぜ
kis9a
0
700
Socio-Technical Evolution: Growing an Architecture and Its Organization for Fast Flow
cer
PRO
0
320
愛される翻訳の秘訣
kishikawakatsumi
1
310
チームをチームにするEM
hitode909
0
300
AIコーディングエージェント(NotebookLM)
kondai24
0
170
まだ間に合う!Claude Code元年をふりかえる
nogu66
4
570
React Native New Architecture 移行実践報告
taminif
1
150
Featured
See All Featured
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.2k
Balancing Empowerment & Direction
lara
5
790
Building Flexible Design Systems
yeseniaperezcruz
330
39k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
253
22k
Visualization
eitanlees
150
16k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.3k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
BBQ
matthewcrist
89
9.9k
The Invisible Side of Design
smashingmag
302
51k
4 Signs Your Business is Dying
shpigford
186
22k
Transcript
GDS入門 1
今日の内容 • 自己紹介 • Graph Datascience Libraryの概要紹介 • neo4j sandboxでの実例紹介
2
自己紹介 名前:竹花洋明 所属:クリエーションライン 前職:IoT関連 現在:クラウド(GCP)、Terraform、DBサポート・PoC(neo4j, mongodb) 3
Graph Data Science Libraryとは? • グラフアルゴリズムをCypher経由で実行できるライブラリ • neo4j database上のデータではなく、in-memory graph形式のデータに対して実行
• 無料のCommunity版と有料のEnterprise版があり、Enterprise版だと以下のような 特徴がある ◦ CPU Core数が無制限 ◦ RBACをサポート ◦ model catalogのいくつかの機能が追加で使用可能 ◦ optimized in-memory graph implementationが使用可能 4
グラフアルゴリズムとは • グラフに対するアルゴリズムで、いくつかの種類に分けられるので次のスライドから はそちらを紹介します • GDS内では成熟度(maturity)により、以下3種類に分けられます ◦ Production-quality ◦ Beta
◦ Alpha 5
Centrality algorithms relationshipの数や向き、hop数等を用いて各ノードをスコア化する。 (影響力の高い人物の検出等に利用 ) GDSで使用可能な主なアルゴリズム: PageRank、Closeness Centrality、Degree Centrality https://neo4j.com/docs/graph-data-science/current/algorithms/page-rank/#algorithms-page-rank
6
Community Detection algorithms 各ノードのrelationshipに基づき、グループに割り当てる (コミュニティ検出等に利用 ) GDSで使用可能な主なアルゴリズム: Louvain、Label Propagation、Weakly Connected
Components https://neo4j.com/docs/graph-data-science/current/algorithms/label-propagation/#algorithms-label-propagation 7
Similarity algorithms ノード間の近似性をスコア化する (recommendation等に利用) GDSで使用可能な主なアルゴリズム: Node Similarity、K-Nearest Neighbors、Jaccard Similarity https://neo4j.com/docs/graph-data-science/current/algorithms/node-similarity/#algorithms-node-similarity
8
その他 • Path finding algorithms • Link Prediction algorithms •
Node embeddings • Machine Learning Models • Auxiliary procedures • Pregel API 9
GDSの内部動作 https://neo4j.com/docs/graph-data-science/current/common-usage/ 10
実例紹介 • neo4j sandbox・・・Webブラウザのみでneo4jの機能や、データセットを元にしたシ ナリオを通してneo4jの学習ができる • 今回は金融系のデータから怪しいアカウントを検出する「Fraud Detection」を実施 します。 11
Fraud Detectionの概要 個人情報を偽装や盗みだしたものを使用している想定。 特徴として複数の人が同じ個人情報を使用している場合が多いので、今回はこれを元 に詐欺を検出する。 Person Person Phone 12
特定の流れ Person Person Phone Person Person Phone Email Email Person
Person Phone Person Person Person Person 1.個人情報を共有している人を 特定しグループ化する 2.共有している個人情報の被り 具合を元に、Similarity(近似 性)をスコア化する 3.1と2を元にグループ内での Similarityから詐欺スコアを算 出する 13
WCC(重みなし) A C B D E 14
WCC(重みなし) A C B D E GroupID:1 GroupID:1 GroupID:1 GroupID:2
GroupID:2 15
WCC(重みあり) A C B D E weight:0.5 weight:1 weight:1 16
WCC(重みあり) A C B D E GroupID:1 GroupID:3 GroupID:1 GroupID:2
GroupID:2 weight:0.5 weight:1 weight:1 17