Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Building Econ Together - Structural Economics as OSS -

Sansan DSOC
August 28, 2020

Building Econ Together - Structural Economics as OSS -

■イベント 
:Econ Fiesta
https://sansan.connpass.com/event/185013/

■登壇概要
タイトル:Building Econ Together - Structural Economics as OSS -
発表者: 
DSOC R&D研究員 Juan Martínez / Takanori Nishida

▼Twitter
https://twitter.com/SansanRandD

Sansan DSOC

August 28, 2020
Tweet

More Decks by Sansan DSOC

Other Decks in Science

Transcript

  1. Building Econ Together
    Sansan株式会社 DSOC R&D研究員
    Juan Martínez / Takanori Nishida
    Structural Economics as OSS

    View full-size slide

  2. ※ 掲載されている内容等は発表時点の情報です。
    ※ 公開に当たり、資料の⼀部を変更・削除している場合があります。

    View full-size slide

  3. Data Strategy and Operation Center
    ⾃⼰紹介
    ⻄⽥ 貴紀 Takanori Nishida
    オンライン名刺
    Sansan株式会社 DSOC R&D SocSci Group Manager /研究員
    Juan Martínez
    オンライン名刺
    マルティネスフアン
    Sansan株式会社 DSOC R&D SocSci Group 研究員/経済学博⼠

    View full-size slide

  4. 「構造推定」とは何か?

    View full-size slide

  5. Data Strategy and Operation Center
    誘導型推定と構造推定
    誘導型推定
    (ex. RCT、線形回帰モデル等)
    構造推定
    概要
    • 被説明変数と説明変数の関係性をモデ
    リングする⽅法
    • 変数間の関係性を⾒るだけでなく、意思決定
    主体が直⾯している問題まで遡り、経済学理
    論をもとにモデリングする⼿法
    • 逆強化学習と捉えられる
    特徴
    • 過去に起きている(観測できている)
    事象の効果を知ることに優れている
    • 過去に起きておらず、観測できていない未知
    の現象でも、モデルの仮定を置いた上で扱う
    ことができる(反実仮想シミュレーション)
    推定
    • パラメータ識別のための「デザイン」
    が重要
    • ライブラリは充実しているので、実装
    は⽐較的容易
    • 理論モデルが必要
    • パラメーターを推定するアルゴリズム/数値
    計算に関する理解
    • ライブラリが限られているため、実装が必要

    View full-size slide

  6. なぜ実務で「構造推定」に取り組んだのか?

    View full-size slide

  7. Data Strategy and Operation Center
    「構造推定」に実務で取り組む意義
    解釈可能なモデリングである
    • ⼀般的な機械学習と⽐べて、ビジネスサイドとのコミュニケーションコストが低くなる
    推定したモデルをもとに反実仮想シミュレーションができる
    • ビジネス戦略の変更/アプリの仕様変更などの意思決定⽀援に役⽴てられる
    • コロナ禍でのビジネス課題の解決に貢献できうる
    プロジェクトメンバーがワクワクする
    • 難易度の⾼い“ムーンショットプロジェクト”である
    • Done is Better than Perfectの精神
    • 取り組む過程において他プロジェクトに活きる学びがある

    View full-size slide

  8. どう「構造推定」を始めたのか?

    View full-size slide

  9. Data Strategy and Operation Center
    Geek Seek Workshop: ランチ勉強会
    • 昼休みにランチ代の補助が出る勉強会を利⽤
    しながらコツコツ学習した
    • 勉強会に利⽤した教材
    • 楠⽥(2020)『経済分析のための構造推定ア
    ルゴリズム』
    • 川⼝康平先⽣の実証IOレクチャーノート
    (https://kohei-kawaguchi.github.io/EmpiricalIO/)
    • アルゴリズムを学び、Pythonで⼿を動かしな
    がら学んだ

    View full-size slide

  10. Data Strategy and Operation Center
    動的離散選択モデル: Rust(1987)バスエンジン交換モデル
    継続利⽤ 交換
    State
    ⾛⾏距離
    Action
    効⽤関数
    バスの状態(⾛⾏距離)を⾒ながら、
    エンジンを交換するか否かの選択をする動的計画問題

    ,
    = &


    +

    = ,



    +

    =

    はメンテナンス費⽤、
    はバス交換費⽤
    • 状態変数は⾛⾏距離(連続変数)をM個のグリッドに分けて作成
    (M = 175)
    ベルマン⽅程式

    = max

    {
    ,
    + 5 ,)
    ,)

    ,
    )}

    View full-size slide

  11. Data Strategy and Operation Center
    法⼈向けクラウド名刺管理サービス Sansanの契約プラン選択モデル
    Cancel Plan A Plan B
    Action
    State
    名刺取込枚数(⽉) ユーザー数 アクティブ率
    × ×
    状態をもとにして、満⾜度(効⽤)が⾼くなるように契約プランを選択していく

    View full-size slide

  12. Data Strategy and Operation Center
    法⼈向けクラウド名刺管理サービス Sansanの契約プラン選択モデル
    State1
    State2
    State3
    Plan A
    名刺取込枚数: 500枚
    ユーザー数: 50 ID
    アクティブ率: 70%
    名刺取込枚数: 900枚
    ユーザー数: 70 ID
    アクティブ率: 70%
    名刺取込枚数: 500枚
    ユーザー数: 50 ID
    アクティブ率: 50%
    名刺取込枚数: 100枚
    ユーザー数: 30 ID
    アクティブ率: 30%
    現状
    将来
    50%
    37%
    13%
    現状から将来の状態と満⾜度を考慮し、⾏動を選択していく
    イメージ

    View full-size slide

  13. Data Strategy and Operation Center
    契約プラン選択モデルを推定してみて・・・
    • 契約プランの固定費⽤を利⽤して名刺1枚をスキャンする価値を⾦銭換算できた
    • ⾮専⾨家でも理解しやすい分析結果を導けた
    • 契約プランごとによって名刺1枚をスキャンする価値の差異があり、
    その差異は契約プランの特徴に合う結果となった
    • 既存顧客企業の契約選択についてAccuracyが約82%の精度で予測できた
    • 推定したモデルを実務で活⽤するにはモデルの改良が必要
    > 理論モデルの作り込み
    > データでは観測されていない状態の推移⾏列の推定
    OSS化することで、誰でも利⽤できるツールに。
    多くの⼈を巻き込みながらオープンに課題を解決していきたい!

    View full-size slide

  14. https://github.com/sansan-inc/econ-source

    View full-size slide

  15. Data Strategy and Operation Center
    Econ Source:経済学をより幅広く使えるように
    シェアする
    • 構造推定モデル
    • 政策評価、因果推論⼿法など
    ビルドする
    • 研究者、データサイエンティスト、
    教員、学⽣、皆が参加できる
    議論する
    • 技術的な課題
    • 新しいライブラリの活躍
    • チャレンジの取り組み
    • ⾯⽩い応⽤事例
    学習する
    • 構造推定を始めたい⼈
    • OSSに貢献してみたい⼈
    • 就活のPRになる

    View full-size slide

  16. Data Strategy and Operation Center
    シェアする:Source DDC
    ➤ 動的離散選択(DDC)モデル推定アルゴリズムのライブラリ
    ➤ Made with
    ➤ Built on top of
    ➤ Hosted in
    ➤ 実装したアルゴリズム:
    • Nested Fixed Point Algorithm (NFXP)(Rust, 1987)
    • Conditional Choice Probability Estimator (Hotz & Miller, 1993)
    • Nested Pseudo-Likelihood (NPL) (Aguirregabiria & Mira, 2002)

    View full-size slide

  17. Data Strategy and Operation Center
    シミュレーションは簡単
    Source DDCのシミュレーションツールを⽤いてデータを作成する:

    View full-size slide

  18. Data Strategy and Operation Center
    推定も簡単
    アルゴリズムを定義し、推定を⾏う:

    View full-size slide

  19. Data Strategy and Operation Center
    テスト
    • pytestを⽤いた単体テストを⽤いて、推定量の属性をテストする
    • 代表的なモデルのMonte Carloシミュレーションを⽤いた単体テスト:
    • GMC Bus Engine Exchange model (Rust, 1987)
    • Rust & Phelan (1997)
    • 安⼼してコードを書いていきましょう!

    View full-size slide

  20. Data Strategy and Operation Center
    詳しくはSource DDCのREADMEファイルを参考に
    https://github.com/sansan-inc/econ-source

    View full-size slide

  21. Data Strategy and Operation Center
    Contributing
    Create an issue
    Describe your request

    View full-size slide

  22. Data Strategy and Operation Center
    構造推定を始めたい⼈に

    View full-size slide