Slide 1

Slide 1 text

Building Econ Together Sansan株式会社 DSOC R&D研究員 Juan Martínez / Takanori Nishida Structural Economics as OSS

Slide 2

Slide 2 text

※ 掲載されている内容等は発表時点の情報です。 ※ 公開に当たり、資料の⼀部を変更・削除している場合があります。

Slide 3

Slide 3 text

Data Strategy and Operation Center ⾃⼰紹介 ⻄⽥ 貴紀 Takanori Nishida オンライン名刺 Sansan株式会社 DSOC R&D SocSci Group Manager /研究員 Juan Martínez オンライン名刺 マルティネスフアン Sansan株式会社 DSOC R&D SocSci Group 研究員/経済学博⼠

Slide 4

Slide 4 text

「構造推定」とは何か?

Slide 5

Slide 5 text

Data Strategy and Operation Center 誘導型推定と構造推定 誘導型推定 (ex. RCT、線形回帰モデル等) 構造推定 概要 • 被説明変数と説明変数の関係性をモデ リングする⽅法 • 変数間の関係性を⾒るだけでなく、意思決定 主体が直⾯している問題まで遡り、経済学理 論をもとにモデリングする⼿法 • 逆強化学習と捉えられる 特徴 • 過去に起きている(観測できている) 事象の効果を知ることに優れている • 過去に起きておらず、観測できていない未知 の現象でも、モデルの仮定を置いた上で扱う ことができる(反実仮想シミュレーション) 推定 • パラメータ識別のための「デザイン」 が重要 • ライブラリは充実しているので、実装 は⽐較的容易 • 理論モデルが必要 • パラメーターを推定するアルゴリズム/数値 計算に関する理解 • ライブラリが限られているため、実装が必要

Slide 6

Slide 6 text

なぜ実務で「構造推定」に取り組んだのか?

Slide 7

Slide 7 text

Data Strategy and Operation Center 「構造推定」に実務で取り組む意義 解釈可能なモデリングである • ⼀般的な機械学習と⽐べて、ビジネスサイドとのコミュニケーションコストが低くなる 推定したモデルをもとに反実仮想シミュレーションができる • ビジネス戦略の変更/アプリの仕様変更などの意思決定⽀援に役⽴てられる • コロナ禍でのビジネス課題の解決に貢献できうる プロジェクトメンバーがワクワクする • 難易度の⾼い“ムーンショットプロジェクト”である • Done is Better than Perfectの精神 • 取り組む過程において他プロジェクトに活きる学びがある

Slide 8

Slide 8 text

どう「構造推定」を始めたのか?

Slide 9

Slide 9 text

Data Strategy and Operation Center Geek Seek Workshop: ランチ勉強会 • 昼休みにランチ代の補助が出る勉強会を利⽤ しながらコツコツ学習した • 勉強会に利⽤した教材 • 楠⽥(2020)『経済分析のための構造推定ア ルゴリズム』 • 川⼝康平先⽣の実証IOレクチャーノート (https://kohei-kawaguchi.github.io/EmpiricalIO/) • アルゴリズムを学び、Pythonで⼿を動かしな がら学んだ

Slide 10

Slide 10 text

Data Strategy and Operation Center 動的離散選択モデル: Rust(1987)バスエンジン交換モデル 継続利⽤ 交換 State ⾛⾏距離 Action 効⽤関数 バスの状態(⾛⾏距離)を⾒ながら、 エンジンを交換するか否かの選択をする動的計画問題 , = & − + = , − − + = • はメンテナンス費⽤、 はバス交換費⽤ • 状態変数は⾛⾏距離(連続変数)をM個のグリッドに分けて作成 (M = 175) ベルマン⽅程式 = max ∈ { , + 5 ,) ,) , )}

Slide 11

Slide 11 text

Data Strategy and Operation Center 法⼈向けクラウド名刺管理サービス Sansanの契約プラン選択モデル Cancel Plan A Plan B Action State 名刺取込枚数(⽉) ユーザー数 アクティブ率 × × 状態をもとにして、満⾜度(効⽤)が⾼くなるように契約プランを選択していく

Slide 12

Slide 12 text

Data Strategy and Operation Center 法⼈向けクラウド名刺管理サービス Sansanの契約プラン選択モデル State1 State2 State3 Plan A 名刺取込枚数: 500枚 ユーザー数: 50 ID アクティブ率: 70% 名刺取込枚数: 900枚 ユーザー数: 70 ID アクティブ率: 70% 名刺取込枚数: 500枚 ユーザー数: 50 ID アクティブ率: 50% 名刺取込枚数: 100枚 ユーザー数: 30 ID アクティブ率: 30% 現状 将来 50% 37% 13% 現状から将来の状態と満⾜度を考慮し、⾏動を選択していく イメージ

Slide 13

Slide 13 text

Data Strategy and Operation Center 契約プラン選択モデルを推定してみて・・・ • 契約プランの固定費⽤を利⽤して名刺1枚をスキャンする価値を⾦銭換算できた • ⾮専⾨家でも理解しやすい分析結果を導けた • 契約プランごとによって名刺1枚をスキャンする価値の差異があり、 その差異は契約プランの特徴に合う結果となった • 既存顧客企業の契約選択についてAccuracyが約82%の精度で予測できた • 推定したモデルを実務で活⽤するにはモデルの改良が必要 > 理論モデルの作り込み > データでは観測されていない状態の推移⾏列の推定 OSS化することで、誰でも利⽤できるツールに。 多くの⼈を巻き込みながらオープンに課題を解決していきたい!

Slide 14

Slide 14 text

https://github.com/sansan-inc/econ-source

Slide 15

Slide 15 text

Data Strategy and Operation Center Econ Source:経済学をより幅広く使えるように シェアする • 構造推定モデル • 政策評価、因果推論⼿法など ビルドする • 研究者、データサイエンティスト、 教員、学⽣、皆が参加できる 議論する • 技術的な課題 • 新しいライブラリの活躍 • チャレンジの取り組み • ⾯⽩い応⽤事例 学習する • 構造推定を始めたい⼈ • OSSに貢献してみたい⼈ • 就活のPRになる

Slide 16

Slide 16 text

Data Strategy and Operation Center シェアする:Source DDC ➤ 動的離散選択(DDC)モデル推定アルゴリズムのライブラリ ➤ Made with ➤ Built on top of ➤ Hosted in ➤ 実装したアルゴリズム: • Nested Fixed Point Algorithm (NFXP)(Rust, 1987) • Conditional Choice Probability Estimator (Hotz & Miller, 1993) • Nested Pseudo-Likelihood (NPL) (Aguirregabiria & Mira, 2002)

Slide 17

Slide 17 text

Data Strategy and Operation Center シミュレーションは簡単 Source DDCのシミュレーションツールを⽤いてデータを作成する:

Slide 18

Slide 18 text

Data Strategy and Operation Center 推定も簡単 アルゴリズムを定義し、推定を⾏う:

Slide 19

Slide 19 text

Data Strategy and Operation Center テスト • pytestを⽤いた単体テストを⽤いて、推定量の属性をテストする • 代表的なモデルのMonte Carloシミュレーションを⽤いた単体テスト: • GMC Bus Engine Exchange model (Rust, 1987) • Rust & Phelan (1997) • 安⼼してコードを書いていきましょう!

Slide 20

Slide 20 text

Data Strategy and Operation Center 詳しくはSource DDCのREADMEファイルを参考に https://github.com/sansan-inc/econ-source

Slide 21

Slide 21 text

Data Strategy and Operation Center Contributing Create an issue Describe your request

Slide 22

Slide 22 text

Data Strategy and Operation Center 構造推定を始めたい⼈に

Slide 23

Slide 23 text

No content