Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GraphDB.pdf

 GraphDB.pdf

jtakai

May 14, 2019
Tweet

More Decks by jtakai

Other Decks in Technology

Transcript

  1. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | 1 近年注⽬される 「グラフデータベース」とは 2019年5⽉14⽇ ⽇本オラクル株式会社 Cloud Transformations & Cloud Solutions 太⽥ 恭介 - 新たな分析の切り⼝ -
  2. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | Safe Harbor Statement The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions. The development, release, timing, and pricing of any features or functionality described for Oracle’s products may change and remains at the sole discretion of Oracle Corporation. 3
  3. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | 4 Graphとは︖Graph DATABASEとは? • Graph • Graph DATABASE 点(node/vertex)と線(edge)で 表現されるデータの集合 Graphデータを格納でき、 Graph演算が可能なDATABASE 弟 同僚 ゴルフ仲間 親しい︓LEVEL5 上司 上司
  4. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | Graphのメリットとは...︖ 5 「つながり/関係」に着⽬した分析が得意 「つながり/関係」の定義や追加が容易 データ構造を視覚的・直感的に理解しやすい つながりの構造やパターンに着⽬した分析が容易で⾼速になる。 データ間の関係性定義や追加、編集はエッジの追加や編集で済む。 点と線の集合によって表現できるため、視覚的にイメージしやすい。 また、可視化によるメリットが⼤きい。
  5. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | 6 Graph DBMSには年々⼈気が集まってきている ”Gartner Identifies Top 10 Data and Analytics Technology Trends for 2019” http://db-engines.com/en/ranking_categories “Graph analytics is a set of analytic techniques that allows for the exploration of relationships between entities of interest such as organizations, people and transactions. The application of graph processing and graph DBMSs will grow at 100 percent annually through 2022 to continuously accelerate data preparation and enable more complex and adaptive data science. Graph data stores can efficiently model, explore and query data with complex interrelationships across data silos, but the need for specialized skills has limited their adoption to date, according to Gartner. Graph analytics will grow in the next few years due to the need to ask complex questions across complex data, which is not always practical or even possible at scale using SQL queries.“ GartnerPressRelease, Feb 18、2019 Trend No.5: Graph https://www.gartner.com/en/newsroom/press-releases/2019-02-18-gartner-identifies-top-10- data-and-analytics-technolo
  6. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | Graph分析で実現できること 7 購買記録 顧客と商品 Twitterなど リコメンデーション インフルエンサーの特定 パターンマッチング コミュニティの検出 (クラスタリング) この送⾦パターンは マネーロンダリングの 疑いがあります 既存顧客の中では 「20代⼥性」と 「40代男性」の コミュニティが⽬⽴ちます あなたにおススメの 商品があります 最初に新商品のDMを 送るのはこの⼈が良いです Relational Databaseでは実現できない/難しい分析がGraph Databaseで可能になることも︕
  7. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | PGXによってグラフデータの参照と演算をサポート 8 • PGX︓Parallel Graph AnalytiX – プロパティグラフ形式のデータに対する参照と演算を⾼速(インメモリ+並列実⾏)に 実⾏するためのエンジン • PGQL︓SQL-likeなグラフデータに対してパターンマッチングでデータを取得する参照⾔語 • グラフ分析アルゴリズム︓媒介中⼼性、次数中⼼性、ページランク etc. 演算系処理 – コンポーネントやコミュニティの検出 – コミュニティ構造の評価 – ランキングとウォーキング – 経路探索 参照系処理 – あるノードの周辺ノードの参照 – プロパティ・パスによる探索 – パターン・マッチング – サブグラフの抽出 3 1 5 2 5 4 2 3 2 3 2 2 1 2 2 1 1 1 参照系処理と演算系処理の双⽅、これらを組み合わせた処理に対応
  8. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | 継続的に分析アルゴリズムのサポートを充実化 9 • 30種類以上のアルゴリズムをbuilt-in – Vertex Betweenness Centrality and variants etc. https://docs.oracle.com/cd/E56133_01/latest/reference/algorithms/index.html • グラフデータに対する機械学習アルゴリズムのためのライブラリを提供 – Deepwalk / Pg2vec https://docs.oracle.com/cd/E56133_01/latest/tutorials/mllib/index.html • ユーザ定義のアルゴリズムが実装可能 – 例)ユーザ定義によるPagerankの実装 https://docs.oracle.com/cd/E56133_01/latest/tutorials/algorithm/pagerank.html
  9. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | 10 Why Oracle? • グラフ・データ形式をネイティブにサポート – Oracle Databaseの機能として Oracle Spatial and Graphオプションを提供 • Spatial機能 / ネットワーク・データ・モデル / RDF・セマンティック・グラフ / プロパティ・グラフ Oracle Database Enterprise Edition Graph機能 Spatial and Graph オプション Oracle Databaseを使⽤いただいている すべてのお客様(※) に使⽤いただくことが可能 • 分析 / 統計処理 / 可視化をサポート – PGXの提供により、⾼速な参照や演算をサポート – OAAgraphの提供により、Rを透過的に利⽤可能 – Cytoscapeプラグインの提供により、 簡易的なグラフデータの可視化をサポート グラフ分析や統計処理、可視化を Oracle Database上にて⼀気通貫で実⾏可能 (※)要 Spatial and Graph Option
  10. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | おしらせ 11 今後もGraph DATABASEに関する勉強会やセッションが予定されています︕ • Oracle Code Tokyo 2019(https://www.oracle.co.jp/events/code/2019/) – 2019年5⽉17⽇(⾦)10:00〜18:00@シェラトン都ホテル東京 – 最新技術動向や、ユースケース、トレンドに関するノウハウなどの情報発信 • B-4-3︓世界はグラフ構造でできている? 〜 超高速クエリから機械学習まで • B-4-4︓GraphPipe and TensorFlow, Serverless and Neural Networks with Fn Project 参加 申込 • PGXユーザ勉強会 #12(https://pgx.connpass.com/event/129205/) – 2019年5⽉16⽇(⽊)17:30 〜 19:45@オラクル青山センター 22F – ユーザーの皆様に役立つ Tips やユースケースの情報交換 参加 申込
  11. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | 12 リファレンス ▼もっと知りたい︕ • Oracle Labs PGX Documentation • Analytics and Data Summit 2019 – Introduction to Graph Analytics and Oracle Cloud Service(※閲覧には要ユーザ登録) • Oracle Labs 発︕ Parallel Graph AnalytiX(PGX) • 関連製品情報 – Oracle Spatial and Graph – Oracle Big Data and Spatial and Graph ▼使ってみたい︕ • GitHub:pgx-training
  12. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    | Appendix:商品のリコメンデーション例 15 購⼊/評価済関係のエッジ まだ購⼊/評価されていないエッジ(リコメンドとして提⽰するエッジ) 顧客が購⼊/評価した商品のレーティング 値から、まだ顧客が購⼊/評価していない 商品のレーティング値を算出し、⾒込みあ る商品をリコメンドとして提⽰。 消費⾏動が類似したユーザを参照し、特 定のユーザがまだ購⼊/評価していない商 品をリコメンドとして提⽰。 参照系処理 ⼀緒に購⼊される商品や類似した特性を もつ商品などの関連性をもとに、特定の商 品に興味を持ちそうなユーザを特定してリ コメンドを提⽰。 演算系処理 【ユーザ間の関連性の参照】 【Matrix Factorizationの適⽤】 【商品間の関連性の参照】 1 4 3 2 5 5 1 5