Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【全7回】グラフはなぜ使われていない?どうやって使われている?グラフデータベース活用事例 #1

【全7回】グラフはなぜ使われていない?どうやって使われている?グラフデータベース活用事例 #1

今回は「銀行送金の可視化と不正検知」編!(オンライン開催)

グラフデータベースと呼ばれる DBMS(正確さのために「グラフ DBMS」と表記します)は 10年以上前から市場に存在しており、今では多くの開発者がその概要、たとえばグラフという直感的なモデルや「辿る」処理の性能メリット、について見聞きしたことがあるかと思います。その一方で、実際のシステム、とりわけ可用性や安定性が求められるビジネス・クリティカルなシステムでグラフ DBMS が採用されている例は今まで非常に稀でした。

グラフというデータモデルは DBMS で扱うビジネス価値がないのでしょうか。または、長らく注目されているグラフのユースケース(金融の不正検知、製造のトレーサビリティ分析、犯罪や税の不正の調査など)には障壁があるのでしょうか。そんな懸念も持たれていましたが、この数年、一転して、いくつもの業種でグラフ DBMS の導入が検討されるようになりました。

このシリーズでは、最近のユースケースを掘り下げて見てみることで、なにがブレークスルーになっているのかを探っていきたいと思います。ご担当業種で今すぐ再利用いただけるネタ・デモなども共有する予定です。以前よりグラフ DBMS の用途を模索しながら悪戦苦闘してきた登壇者が、その失敗経験なども交えながら、まだまだ進化していくデータベースの面白さをお伝えします。

1 銀行送金の可視化と不正検知 11/17(木) 本ページ
2 犯罪や税不正、利益相反の調査 12/08(木) 予定
3 仮)部品表とトレーサビリティ 01/12(木) 予定
4 仮)リコメンデーションと機械学習 02/09(木) 予定
5 仮)配送計画の最適化と見える化 03/09(木) 予定
6 仮)通話履歴の分析、詐欺の検出 04/13(木) 予定
7 仮)社員の協業の可視化と評価 05/11(木) 予定

oracle4engineer

November 18, 2022
Tweet

More Decks by oracle4engineer

Other Decks in Technology

Transcript

  1. グラフはなぜ使われていない?どうやって使われている?
    グラフデータベース活用事例まとめ
    #1「銀行送金の可視化と不正検知」編
    Ryota Yamanaka
    Product Manager Asia-Pacific
    Spatial and Graph, Product Development
    Nov 17, 2022

    View full-size slide

  2. ユースケース概要、顧客事例、デモコンテンツを紹介します
    • 第1回(11月17日)銀行送金の可視化と不正検知(金融)
    • 第2回(12月08日)犯罪や税不正、利益相反の調査(公共)
    • 第3回(01月12日)部品表とトレーサビリティ(製造)
    • 第4回(02月09日)リコメンデーションと機械学習(小売)
    • 第5回(03月09日)配送計画の最適化と見える化(物流)
    • 第6回(04月13日)通話履歴の分析、詐欺の検出(通信)
    • 第7回(05月11日)社員の協業の可視化と評価(人事)
    対象:各インダストリでグラフデータベースの導入を検討されている方、
    グラフという技術に興味がある方(コンプするとグラフエキスパートになれる?)
    このシリーズの予定
    Copyright © 2022, Oracle and/or its affiliates
    2

    View full-size slide

  3. Oracle Graph に関する情報
    • 日本語
    • このシリーズのスライドの公開先
    • https://oracle-code-tokyo-dev.connpass.com/event/265244/
    • CodeZine 記事「グラフ・データベースはなぜ使われてこなかったか、その展望とは」
    • https://codezine.jp/article/detail/16539
    • Qiita: https://qiita.com/tags/oraclegraph
    • Twitter: https://twitter.com/uraryotas
    • 英語
    • Medium: https://medium.com/tag/oracle-graph
    • LinkedIn: https://www.linkedin.com/groups/1848520/
    • YouTube: https://www.youtube.com/channel/UCZqBavfLlCuS0il6zNY696w
    Copyright © 2022, Oracle and/or its affiliates
    3

    View full-size slide

  4. Copyright © 2022, Oracle and/or its affiliates
    4
    ユースケース紹介

    View full-size slide

  5. Solution - Query to Follow Money
    Copyright © 2022, Oracle and/or its affiliates
    5
    100
    Alice
    200
    Bob
    300
    Charlie
    400
    Dave
    1111
    2222
    3333
    4444
    5555
    $20,000
    $20,000
    $30,000
    $10,000
    • The graph representation of the transaction data
    makes queries intuitive and performant.
    • E.g., the queries for finding the circular money
    transfer over multiple intermediate steps can be
    easily written and executed.
    • Traversal queries enable the detection of hidden
    relationships between accounts and their owners
    (e.g. paradise papers).
    • Complex rules to score suspicious accounts (e.g.,
    closeness to known fraud accounts) can also be
    expressed in graph queries and executed in a
    short response time.

    View full-size slide

  6. Solution - 360 Degrees Visualization
    Copyright © 2022, Oracle and/or its affiliates
    6
    • The graph visualization component can show the
    original graph data on web browsers. This is
    useful for manual inspection against "suspicious"
    accounts (which are often detected by rules or
    machine learning models).
    • Users can "expand" the graph by clicking
    particular nodes to see the related information.
    • Users can also run PGQL queries to find the
    accounts in certain conditions. This helps users
    examine the existing rules, as well as try and
    create new rules.

    View full-size slide

  7. Solution - Enhancing Machine Learning Models
    Copyright © 2022, Oracle and/or its affiliates
    7
    ID Feature1 Feature 2 Feature 3
    1001
    1002
    1003
    Raw
    Data
    Graph
    View
    Feature 4 Feature 5 Feature 6 Feature 7 Target
    Yes
    No
    No
    • New scores for accounts are calculated based on relationships and by rules and graph algorithms
    • The scores are used as input features to enhance the prediction models

    View full-size slide

  8. Copyright © 2022, Oracle and/or its affiliates
    8
    顧客事例

    View full-size slide

  9. Reference - Paysafe
    Copyright © 2022, Oracle and/or its affiliates
    9
    • Providing online payment solutions
    • Real-time payments, e-Wallets
    • 1B revenue/year, 500K payments/day
    • Strong demand for fraud detection
    • Combination with rule-based approach
    and machine learning
    • In real-time, upon money movement
    • More information
    • AnD Summit : 2020 slides, 2019 slides
    • YouTube : video

    View full-size slide

  10. Reference - Paysafe (Query)
    Copyright © 2022, Oracle and/or its affiliates
    10
    Analytics and Data (AnD) Summit 2020 Presentation
    • The queries to follow transactions multiple hops
    need to join the tables multiple times.
    • The existing complex SQL queries were rewritten
    into PGQL queries.
    • Queries become much simpler
    • e.g. 32 lines --> 7 lines
    • Queries become much faster
    • e.g. 50 min --> 0.5 sec
    • Possible to run the queries that didn't complete
    in reasonable time by SQL.

    View full-size slide

  11. Reference - Paysafe (Visualization)
    Copyright © 2022, Oracle and/or its affiliates
    11
    Analytics and Data (AnD) Summit 2020 Presentation
    • Visualization of money flows is essential to
    manually check the activities of suspicious
    accounts, as well as to understand the common
    fraud patterns.
    • Using this custom visualization application,
    interesting networks such as possible money
    laundering flows (typically consists of 3 steps :
    placement, layering, integration) were detected.
    • Using device fingerprints, the multiple accounts
    using the same device, and their money flows
    are also visualized.

    View full-size slide

  12. Reference - Paysafe (Machine Learning)
    Copyright © 2022, Oracle and/or its affiliates
    12
    Analytics and Data (AnD) Summit 2020 Presentation
    • Introduction of graph visualization and graph
    analytics helps the investigations of fraud
    specialists, and saves a lot of time and effort.
    • For further automation, the fraud patterns should
    be also detected without human intervention. For
    this goal, machine learning will be combining
    with graphs.
    • Graph embedding techniques such as DeepWalk
    was experimented, and this feature improved the
    accuracy of the machine learning model
    significantly.

    View full-size slide

  13. Copyright © 2022, Oracle and/or its affiliates
    13
    デモの内容

    View full-size slide

  14. グラフモデルによる銀行送金トランザクションの記述
    • 銀行の送金データをグラフで分析する(パート1)
    • https://qiita.com/ryotayamanaka/items/b2ee1c78807c1328b96f
    Copyright © 2022, Oracle and/or its affiliates
    14

    View full-size slide

  15. 表からグラフの作成、グラフクエリによるパターンマッチと結果の可視化
    • 銀行の送金データをグラフで分析する(パート2)
    • https://qiita.com/ryotayamanaka/items/99a64b10f8f1f6456175
    Copyright © 2022, Oracle and/or its affiliates
    15

    View full-size slide

  16. Graph Server を利用した、経路検索、アルゴリズム、グラフの変換
    • 銀行の送金データをグラフで分析する(パート3)
    • https://qiita.com/ryotayamanaka/items/de13a0a638a24dcf5688
    Copyright © 2022, Oracle and/or its affiliates
    16

    View full-size slide

  17. 機械学習の性能を向上するためにグラフを活用する方法
    • 機械学習のためのグラフ活用(金融不正検知)
    • Qiita 記事近日公開
    Copyright © 2022, Oracle and/or its affiliates
    17
    Account
    acc_id
    first_name
    last_name
    ..
    pagerank
    betweeness cent.
    eigenvector cent.
    label_propagation
    conductance
    ..
    is_fraud

    View full-size slide

  18. ADB Graph Studio を使用して上述のシナリオを試すためのサンプル
    • 銀行の送金データをグラフで分析する(Graph Studio)
    • Qiita 記事近日公開
    Copyright © 2022, Oracle and/or its affiliates
    18

    View full-size slide

  19. Copyright © 2022, Oracle and/or its affiliates
    19
    デモ!

    View full-size slide

  20. Copyright © 2022, Oracle and/or its affiliates
    20
    おわりに

    View full-size slide

  21. Oracle Graph に関する情報 (再掲)
    • 日本語
    • このシリーズのスライドの公開先
    • https://oracle-code-tokyo-dev.connpass.com/event/265244/
    • CodeZine 記事「グラフ・データベースはなぜ使われてこなかったか、その展望とは」
    • https://codezine.jp/article/detail/16539
    • Qiita: https://qiita.com/tags/oraclegraph
    • Twitter: https://twitter.com/uraryotas
    • 英語
    • Medium: https://medium.com/tag/oracle-graph
    • LinkedIn: https://www.linkedin.com/groups/1848520/
    • YouTube: https://www.youtube.com/channel/UCZqBavfLlCuS0il6zNY696w
    Copyright © 2022, Oracle and/or its affiliates
    21

    View full-size slide

  22. Oracle Graph のワークショップ(英語)
    ADB Graph Studio
    • Getting Started with Graph Studio on Oracle Autonomous Database
    https://apexapps.oracle.com/pls/apex/dbpm/r/livelabs/view-workshop?wid=758
    • Graph Studio: Finding Circular Payment Chains using Graph Queries in Autonomous Database
    https://apexapps.oracle.com/pls/apex/dbpm/r/livelabs/view-workshop?wid=770
    Grapy Server and Client
    • Analyze, Query, and Visualize Graphs in Oracle Database
    How to setup the Marketplace image with Autonomous Database and use queries and algorithms
    https://apexapps.oracle.com/pls/apex/dbpm/r/livelabs/view-workshop?wid=686
    Copyright © 2022, Oracle and/or its affiliates
    22

    View full-size slide