Upgrade to Pro — share decks privately, control downloads, hide ads and more …

グラフの機械学習手法 Pg2vec

Avatar for Kohei Saito Kohei Saito
August 22, 2019
40

グラフの機械学習手法 Pg2vec

『グラフの機械学習手法 Pg2vec』Modern Cloud Days発表用スライド。※本資料に記述された見解は私個人の見解であり、所属する会社&組織の見解を必ずしも反映したものではありません。ご了承ください。

Avatar for Kohei Saito

Kohei Saito

August 22, 2019
Tweet

Transcript

  1. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    Kohei Saito ([email protected]) Associate Consultant, Oracle August 07, 2019 グラフの機械学習手法 Pg2vec
  2. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    ユーザ勉強会参加のお願い • PGX ユーザーグループ(connpass) 2
  3. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    Pg2vecとは グラフデータの特徴を抽出する 目的 A B C D E F A B C D E F A C B E D F グラフの分類に役立てる 3
  4. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    グラフの分類 想定する状況 • グラフサイズが大きい • 小さく区切って分類したい • 化学化合物の作用を分類する • 犯罪を予防する 例えば… 「同じような構造を持つグラフは同じような表現になってほしい」 https://ja.wikipedia.org/wiki/%E3%83%95%E3%82% A1%E3%82%A4%E3%83%AB:Human_interactome.jp g 4
  5. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    グラフ分類の難しさ • そもそもグラフが「同型」かを判定することすら計算困難 •「計算困難」 多項式時間アルゴリズムが見つかっていない (盛んに議論されている) 5
  6. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    どうにかグラフを分類できないものか? 6
  7. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    Pg2vec処理の流れ A C B E D F Start Paragrap h Vector (PV-DM) 特徴抽出 Input (後述) Random Walk edge-word対応付け 学習 特徴抽出 7
  8. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    Edge_ID Source_ID Destination_ ID Relation_Typ e Start_Date 100001 A B Manage 2019-04-01 100002 A C Manage 2019-04-01 100003 A F Colleague 2019-05-01 100004 B C Colleague 2019-05-01 100005 B E Manage 2019-05-15 100006 C D Colleague 2019-05-16 100007 D E Colleague 2019-06-01 100008 E F Manage 2019-06-30 エッジを読み取る Random Walk edge-word対応付け 学習 8
  9. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    ランダムウォークで何をしているのか Edge_ID Source_ID Destination_ ID Relation_Typ e Start_Date 100001 A B Manage 2019-04-01 100002 A C Manage 2019-04-01 100003 A F Colleague 2019-05-01 100004 B C Colleague 2019-05-01 100005 B E Manage 2019-05-15 100006 C D Colleague 2019-05-16 100007 D E Colleague 2019-06-01 100008 E F Manage 2019-06-30 各行はエッジを表す https://docs.oracle.com/cd/E94208_01/BDSPA/using-property- graphs-big-data.htm Random Walk edge-word対応付け 学習 edge-word edge-word edge-word edge-word 9
  10. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    Paragraph Vector(PV-DM) Graph ID 入力層 隠れ層 出力層 Random Walk edge-word対応付け 学習 edge-word edge-word edge-word edge-word 10
  11. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    Pg2vec処理の流れ A C B E D F Start Paragraph Vector (PV-DM) Input Random Walk edge-word対応付け 学習 特徴抽出 11
  12. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    デモ https://docs.oracle.com/cd/E56133_01/latest/prog- guides/mllib/pg2vec.html Documentをご確認ください! 12
  13. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    Pg2vecとは 難しかったグラフの分類をできるようするために作られた アルゴリズム 13
  14. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    関連イベント • PGX ユーザーグループ(connpass) 14
  15. Copyright © 2019, Oracle and/or its affiliates. All rights reserved.

    ご清聴ありがとうございました! 15