Upgrade to Pro — share decks privately, control downloads, hide ads and more …

PageRankとその応用

 PageRankとその応用

Transcript

  1. 1 ページランクの概要 • ウェブページのランク付けを行うアルゴリズム。 • ページをノード、リンクをエッジとして右図のような有 向グラフでネットワークを表す。 • ランクの定義 ◦

    被リンク数が多いページほどランクが高い(ペー ジ1)。 ◦ また被リンク数が多いページからリンクされてい るページもランクが高い(ページ5)。 論文:The PageRank Citation Ranking : Bringing Order to the Web, 1998, L.Page
  2. 2 ページランクの算出 ページランクは、隣接行列a(実際にはランダム ジャンプなども考慮してGoogle行列という行列が 用いられる)の固有値問題を解くことで求められ る。 import numpy as np

    a = np.array([[0, 1/2, 0, 1/2, 0, 0], [0, 0, 0, 0, 0, 1], [0, 0, 0, 1, 0, 0], [0, 1, 0, 0, 0, 0], [0, 1, 0, 0, 0, 0], [1/6, 1/6, 1/6, 1/6, 1/6, 1/6]]) ret = np.linalg.eig(a.T) pr = np.abs(ret[1][:, 0] / np.sum(ret[1][:, 0])) for i in range(6): print("node ", i, ":", '{:.3f}'.format(pr[i])) node 4 : 0.061 node 5 : 0.364 node 1 : 0.303 node 0 : 0.061 node 3 : 0.152 node 2 : 0.061