Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Building Econ Together - Structural Economics a...

Sansan DSOC
August 28, 2020

Building Econ Together - Structural Economics as OSS -

■イベント 
:Econ Fiesta
https://sansan.connpass.com/event/185013/

■登壇概要
タイトル:Building Econ Together - Structural Economics as OSS -
発表者: 
DSOC R&D研究員 Juan Martínez / Takanori Nishida

▼Twitter
https://twitter.com/SansanRandD

Sansan DSOC

August 28, 2020
Tweet

More Decks by Sansan DSOC

Other Decks in Science

Transcript

  1. Data Strategy and Operation Center ⾃⼰紹介 ⻄⽥ 貴紀 Takanori Nishida

    オンライン名刺 Sansan株式会社 DSOC R&D SocSci Group Manager /研究員 Juan Martínez オンライン名刺 マルティネスフアン Sansan株式会社 DSOC R&D SocSci Group 研究員/経済学博⼠
  2. Data Strategy and Operation Center 誘導型推定と構造推定 誘導型推定 (ex. RCT、線形回帰モデル等) 構造推定

    概要 • 被説明変数と説明変数の関係性をモデ リングする⽅法 • 変数間の関係性を⾒るだけでなく、意思決定 主体が直⾯している問題まで遡り、経済学理 論をもとにモデリングする⼿法 • 逆強化学習と捉えられる 特徴 • 過去に起きている(観測できている) 事象の効果を知ることに優れている • 過去に起きておらず、観測できていない未知 の現象でも、モデルの仮定を置いた上で扱う ことができる(反実仮想シミュレーション) 推定 • パラメータ識別のための「デザイン」 が重要 • ライブラリは充実しているので、実装 は⽐較的容易 • 理論モデルが必要 • パラメーターを推定するアルゴリズム/数値 計算に関する理解 • ライブラリが限られているため、実装が必要
  3. Data Strategy and Operation Center 「構造推定」に実務で取り組む意義 解釈可能なモデリングである • ⼀般的な機械学習と⽐べて、ビジネスサイドとのコミュニケーションコストが低くなる 推定したモデルをもとに反実仮想シミュレーションができる

    • ビジネス戦略の変更/アプリの仕様変更などの意思決定⽀援に役⽴てられる • コロナ禍でのビジネス課題の解決に貢献できうる プロジェクトメンバーがワクワクする • 難易度の⾼い“ムーンショットプロジェクト”である • Done is Better than Perfectの精神 • 取り組む過程において他プロジェクトに活きる学びがある
  4. Data Strategy and Operation Center Geek Seek Workshop: ランチ勉強会 •

    昼休みにランチ代の補助が出る勉強会を利⽤ しながらコツコツ学習した • 勉強会に利⽤した教材 • 楠⽥(2020)『経済分析のための構造推定ア ルゴリズム』 • 川⼝康平先⽣の実証IOレクチャーノート (https://kohei-kawaguchi.github.io/EmpiricalIO/) • アルゴリズムを学び、Pythonで⼿を動かしな がら学んだ
  5. Data Strategy and Operation Center 動的離散選択モデル: Rust(1987)バスエンジン交換モデル 継続利⽤ 交換 State

    ⾛⾏距離 Action 効⽤関数 バスの状態(⾛⾏距離)を⾒ながら、 エンジンを交換するか否かの選択をする動的計画問題 , = & − + = , − − + = • はメンテナンス費⽤、 はバス交換費⽤ • 状態変数は⾛⾏距離(連続変数)をM個のグリッドに分けて作成 (M = 175) ベルマン⽅程式 = max ∈ { , + 5 ,) ,) , )}
  6. Data Strategy and Operation Center 法⼈向けクラウド名刺管理サービス Sansanの契約プラン選択モデル Cancel Plan A

    Plan B Action State 名刺取込枚数(⽉) ユーザー数 アクティブ率 × × 状態をもとにして、満⾜度(効⽤)が⾼くなるように契約プランを選択していく
  7. Data Strategy and Operation Center 法⼈向けクラウド名刺管理サービス Sansanの契約プラン選択モデル State1 State2 State3

    Plan A 名刺取込枚数: 500枚 ユーザー数: 50 ID アクティブ率: 70% 名刺取込枚数: 900枚 ユーザー数: 70 ID アクティブ率: 70% 名刺取込枚数: 500枚 ユーザー数: 50 ID アクティブ率: 50% 名刺取込枚数: 100枚 ユーザー数: 30 ID アクティブ率: 30% 現状 将来 50% 37% 13% 現状から将来の状態と満⾜度を考慮し、⾏動を選択していく イメージ
  8. Data Strategy and Operation Center 契約プラン選択モデルを推定してみて・・・ • 契約プランの固定費⽤を利⽤して名刺1枚をスキャンする価値を⾦銭換算できた • ⾮専⾨家でも理解しやすい分析結果を導けた

    • 契約プランごとによって名刺1枚をスキャンする価値の差異があり、 その差異は契約プランの特徴に合う結果となった • 既存顧客企業の契約選択についてAccuracyが約82%の精度で予測できた • 推定したモデルを実務で活⽤するにはモデルの改良が必要 > 理論モデルの作り込み > データでは観測されていない状態の推移⾏列の推定 OSS化することで、誰でも利⽤できるツールに。 多くの⼈を巻き込みながらオープンに課題を解決していきたい!
  9. Data Strategy and Operation Center Econ Source:経済学をより幅広く使えるように シェアする • 構造推定モデル

    • 政策評価、因果推論⼿法など ビルドする • 研究者、データサイエンティスト、 教員、学⽣、皆が参加できる 議論する • 技術的な課題 • 新しいライブラリの活躍 • チャレンジの取り組み • ⾯⽩い応⽤事例 学習する • 構造推定を始めたい⼈ • OSSに貢献してみたい⼈ • 就活のPRになる
  10. Data Strategy and Operation Center シェアする:Source DDC ➤ 動的離散選択(DDC)モデル推定アルゴリズムのライブラリ ➤

    Made with ➤ Built on top of ➤ Hosted in ➤ 実装したアルゴリズム: • Nested Fixed Point Algorithm (NFXP)(Rust, 1987) • Conditional Choice Probability Estimator (Hotz & Miller, 1993) • Nested Pseudo-Likelihood (NPL) (Aguirregabiria & Mira, 2002)
  11. Data Strategy and Operation Center テスト • pytestを⽤いた単体テストを⽤いて、推定量の属性をテストする • 代表的なモデルのMonte

    Carloシミュレーションを⽤いた単体テスト: • GMC Bus Engine Exchange model (Rust, 1987) • Rust & Phelan (1997) • 安⼼してコードを書いていきましょう!