Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Finding Key Players in Networks

Sansan DSOC
August 28, 2020

Finding Key Players in Networks

■イベント 
:Econ Fiesta
https://sansan.connpass.com/event/185013/

■登壇概要
タイトル:Finding Key Players in Networks
発表者: 
DSOC R&D研究員 小松尚太

▼Twitter
https://twitter.com/SansanRandD

Sansan DSOC

August 28, 2020
Tweet

More Decks by Sansan DSOC

Other Decks in Science

Transcript

  1. Finding Key Players in Networks
    Sansan株式会社 DSOC
    R&D研究員 ⼩松尚太

    View Slide

  2. ※ 掲載されている内容等は発表時点の情報です。
    ※ 公開に当たり、資料の⼀部を変更・削除している場合があります。

    View Slide

  3. Data Strategy and Operation Center
    ⾃⼰紹介
    • 農学修⼠
    • 2020年5⽉⼊社
    • 前職はコートジボワールにある
    国際農業研究機関
    ⼩松 尚太
    Sansan株式会社 DSOC
    R&D 研究員
    Shota Komatsu
    オンライン名刺

    View Slide

  4. ネットワークにおける「キープレーヤー」は誰か?
    Question

    View Slide

  5. Data Strategy and Operation Center
    キープレーヤーの定義 (Ballester et al., 2006)
    そのノードをネットワーク から取り除いたとき、
    ネットワーク全体の活動量 ∗ が最も下がるようなノード。
    ∗ = arg max
    "
    (∗ − ∗(#"
    ))
    キープレーヤー中⼼性

    View Slide

  6. この場合、
    A: 60 - 40 = 20、B: 60 - 55 = 5
    AがKey Playerとなる
    B A
    パフォーマンス: 60
    A
    40
    B 55

    View Slide

  7. Data Strategy and Operation Center
    数々のキープレーヤー問題
    • ⻘少年ネットワークにおける⾮⾏のキープレーヤー (Liu et al., 2020)
    • 企業間のR&Dネットワークにおけるキープレーヤー (Köing et al., 2019)
    • アフリカの経済活動のKey Districts (Amarasinghe et al., 2020)
    • 第⼆次コンゴ戦争におけるKey Groups (Köing et al., 2017)

    View Slide

  8. Data Strategy and Operation Center
    キープレーヤー特定における課題
    1. ネットワーク上のノード間の相互作⽤をどう識別するか?
    2. あるノードを取り除いたあと、残りのネットワークはどう変化するか?
    • 本発表では、ノードを取り除いても残りのネットワークは変化しないと仮定

    View Slide

  9. ネットワーク上のノード間の
    相互作⽤をどう識別するか

    View Slide

  10. Data Strategy and Operation Center
    ネットワーク上のノード間の相互作⽤
    !
    !"
    "
    !
    !"
    "
    つながっている他のノードのアウトカム
    (Spillover effect)
    ⾃⾝のノードの属性
    つながっている他のノードの平均的な属性
    (Contextual effect)

    View Slide

  11. Data Strategy and Operation Center
    ネットワーク上のノード間の相互作⽤
    • ネットワーク上のつながりを表現した隣接⾏列 を⽤いて、
    = + 1!
    "
    + #
    + )
    $
    +
    ⟹ = !
    − %#(1!
    "
    + #
    + )
    $
    + )
    と表現できる。
    Spillover effect Contextual effects

    View Slide

  12. Data Strategy and Operation Center
    ネットワーク全体の活動量の計算
    • キープレーヤー特定のために、ネットワーク全体の活動量 ∗が必要。
    • パラメーターを推定して、
    0
    ∗ = 1' !
    − 2
    %#
    (1!
    3
    "
    + 3
    #
    + )
    3
    $
    )
    を計算したい。

    View Slide

  13. Data Strategy and Operation Center
    パラメーター推定の阻害要因
    Spillover effect:
    アウトカム決定の同時性
    アウトカムとつながり両⽅に
    影響をあたえる要因
    !
    !"
    "
    !

    View Slide

  14. Data Strategy and Operation Center
    同時性バイアスにどう対処するか?
    Liu et al. (2020)
    隣接⾏列 が外⽣的なとき、操作変数⾏列を
    = [1!
    , , *
    , 1!
    , , *
    ]
    として、以下のモーメント条件を⽤いてパラメーターを推定する。
    " − − #
    1!
    − $
    − *
    %
    = 0

    View Slide

  15. Data Strategy and Operation Center
    操作変数のアイデア
    「友達の友達」を利⽤する (Bramoullé, Djebbari, and Fortin, 2009)
    i
    j
    k
    a
    Spillover effect

    View Slide

  16. Data Strategy and Operation Center
    ネットワーク⽣成の内⽣性への対処
    • ネットワークそのものが内⽣的に決まる場合はどうするか?
    Kelejian and Piras (2014), Köing et al. (2019), Liu et al. (2020)
    ノード と がどれだけ似ているかを捉えた、外⽣的なホモフィリー指標
    (例えば、同じ性別かどうか)を⽤いて、隣接⾏列 を予測する。
    操作変数で⽤いられている を予測された隣接⾏列 '
    に置き換え、
    ⼆段階最⼩⼆乗法/GMMにより推定する。

    View Slide

  17. Data Strategy and Operation Center
    Monte Carlo Simulation

    View Slide

  18. Data Strategy and Operation Center
    推定⽅法のまとめ
    1. リンクが形成される確率 Pr("#
    = 1) を、外⽣的なホモフィリー指標を
    ⽤いて予測し、予測された隣接⾏列 '
    を得る。
    2. 予測された隣接⾏列 '
    を⽤いて、操作変数⾏列を作る。
    3. ⼆段階最⼩⼆乗法/GMMを⽤いて、パラメーターを推定する。

    View Slide

  19. Data Strategy and Operation Center
    キープレーヤー特定のアルゴリズム
    各ノード に対して、以下のようにキープレーヤー中⼼性を計算する。
    1. ネットワーク から、ノード を取り除く。
    2. ノード を取り除いたときのネットワーク全体の活動量 ∗("#
    ) を、
    ∗ "#
    = 1$
    % $
    − *
    "#
    "&
    (1$
    -
    '
    + "#
    -
    &
    + 1
    "#
    -
    (
    )として計算する。
    3. 同様に ∗ Λܭࢉ͠ɺΩʔϓϨʔϠʔத৺ੑ ∗ − ∗ "#
    を求める。
    キープレーヤー中⼼性が⾼いノードを、そのネットワークのキープレーヤーとする。

    View Slide

  20. 応⽤例1 :
    ⽇本の市区町村ネットワークで
    経済活動を⽀えるキープレーヤー

    View Slide

  21. Data Strategy and Operation Center
    南関東における市区町村のキープレーヤーはどこか?
    名刺アプリ「Eight」の名刺交換データから、市区町村間のネットワークを構
    築し、南関東における市区町村のキープレーヤーを特定。
    詳細は「Sansan, speaker deck, key cities」で検索下さい。
    https://speakerdeck.com/sansandsoc/the-economics-of-business-networks-and-key-cities
    * 分析に際しては個⼈を匿名化し、2017年1⽉1⽇から2017年12⽉31⽇までに⾏われた名刺交換の情報を、
    Eightの利⽤規約で許諾を得ている範囲で使⽤した。

    View Slide

  22. View Slide

  23. Data Strategy and Operation Center
    南関東における市区町村のキープレーヤー
    都道府県 市区町村名
    東京都 新宿区
    東京都 渋⾕区
    東京都 港区
    東京都 杉並区
    東京都 世⽥⾕区
    東京都 品川区
    東京都 武蔵野市
    東京都 中野区
    埼⽟県 さいたま市⼤宮区
    神奈川県 横浜市⻄区

    View Slide

  24. 応⽤例2 :
    ITツールの利⽤を⽀えるキープレーヤー

    View Slide

  25. Data Strategy and Operation Center
    ⽬的
    ITツールの利活⽤を⽀えるキープレーヤーを利⽤者の中から特定する
    • ITツールの利⽤率を向上させる取り組みに活⽤できる可能性がある
    • 企業内に蓄積されるITツールの利⽤データ(情報資産)の
    新たな活⽤⽅法になり得る
    • ຊ෼ੳͰ͸ɺࣾ಺ωοτϫʔΫΛ໌Β͔ʹ͢ΔͨΊʹɺ
    ࣗࣾʢ4BOTBOגࣜձࣾʣ಺ݶΓͰڞ༗͞Ε͍ͯΔ໊ࢗަ׵ʹؔ͢Δ
    σʔλΛར༻

    View Slide

  26. クラウド名刺管理サービス
    名刺管理から、働き⽅を変える

    View Slide

  27. Data Strategy and Operation Center
    ITツールの利⽤を⽀える社内のキープレーヤーは誰か?
    ⽉間利⽤率(⽉) : 60 ⽉間利⽤率 : ???
    • ツールのヘビーユーザーと⼀緒に仕事すると、共にツールを使うので利⽤率が⾼まる
    • ⼀緒に仕事した⼈の役職や部署ごとの使い⽅に影響を受ける

    View Slide

  28. Data Strategy and Operation Center
    使⽤したネットワークデータ
    Sansan株式会社の社内ネットワークを、名刺交換に基づき推定。
    A
    B
    C
    D
    E
    W社
    鈴⽊さん
    X社
    斎藤さん
    Y社
    佐藤さん
    Z社
    斎藤さん
    A
    B
    C
    D
    E

    View Slide

  29. Data Strategy and Operation Center
    Sansan株式会社の社内ネットワーク

    View Slide

  30. Data Strategy and Operation Center
    Key Player Profiling
    • 誰がキープレーヤーであるか?
    • どの変数が効いてキープレーヤーとなったのか?

    View Slide

  31. まとめ

    View Slide

  32. Data Strategy and Operation Center
    まとめ
    • 「ネットワーク上のキープレーヤーは誰か」という問いに答えたい
    • ネットワークのノード間の相互作⽤を識別する必要性
    • ネットワーク計量経済学の⽬覚ましい発展がそれを可能としつつある
    • 分析⼿法のさらなる洗練、実務への応⽤を追求していく

    View Slide

  33. Data Strategy and Operation Center
    References
    - Amarasinghe, A., Hodler, R., Raschky, P. A., & Zenou, Y. (2020). “Key Players in Economic
    Development.” IZA Discussion Papers, No. 13071, Institute for the Study of Labor (IZA), Bonn.
    - Ballester, C., Calvó-Armengol, A., & Zenou, Y. (2006). “Who's who in networks. Wanted: The
    key player.” Econometrica, 74(5), 1403-1417.
    - Bramoullé, Y., Djebbari, H., & Fortin, B. (2009). Identification of peer effects through social
    networks. Journal of econometrics, 150(1), 41-55.
    - Kelejian, H. H., & Piras, G. (2014). “Estimation of spatial models with endogenous weighting
    matrices, and an application to a demand model for cigarettes.” Regional Science and Urban
    Economics, 46, 140-149.
    - König, M. D., Liu, X., & Zenou, Y. (2019). R&D networks: Theory, empirics, and policy
    implications. Review of Economics and Statistics, 101(3), 476-491.
    - König, M. D., Rohner, D., Thoenig, M., & Zilibotti, F. (2017). Networks in conflict: Theory and
    evidence from the great war of africa. Econometrica, 85(4), 1093-1132.
    - Lee, L. F., Liu, X., Patacchini, E., & Zenou, Y. (2020). “Who is the key player? A network
    analysis of juvenile delinquency.” Journal of Business & Economic Statistics, 1-9.

    View Slide

  34. View Slide