Slide 1

Slide 1 text

実験デザインと因果探索の ミッシングリンクに関する調査 Asei Sugiyama

Slide 2

Slide 2 text

⾃⼰紹介 杉⼭ 阿聖 Software Engineer @ Repro AI Labs TensorFlow コントリビューター TFX : Issue ⽴てたり PR ⽴てたり docs-l10n : 翻訳 & レビュー 機械学習図鑑 共著

Slide 3

Slide 3 text

⽬的 . 異なる A/B テストを何度も⾏うことで知⾒を得る⼿法である分散分析 と、その発展について明らかにしたい . 実験デザインがなぜ機械学習勢やマーケターに浸透していないのかを明 らかにしたい

Slide 4

Slide 4 text

概要 実験デザインは⽣命科学の分野ではデータから知⾒を導くための⼿法と して重要性が知られている ⼀⽅、機械学習勢の間では広く議論されておらず、現代までのどこかで 断絶が発⽣している そこで、実験デザインのその後の発展について、適⽤分野を含めて調査 を⾏い、因果探索までの発展の道のりを明らかにした また、実験デザインが知られていない理由を検討し、利⽤の難易度と流 派の対⽴に原因があるのではないかという仮説を⽴てられた

Slide 5

Slide 5 text

TOC 問題設定: 繰り返しのある A/B テスト <- 実験デザインによる解析⼿法の違い 分散分析とそのマーケティングへの応⽤ 構造解析とそのマーケティングへの応⽤ 構造解析とベイズモデリング・因果探索 それぞれの解析⼿法の利⽤⽅法 議論 まとめ

Slide 6

Slide 6 text

問題設定: 繰り返しのある A/B テスト 単純な A/B テスト 画像と⽂⾯の組み合わせによるテスト 課題: 画像を変えることと⽂⾯を変えることのどちらが重要か?

Slide 7

Slide 7 text

単純な A/B テスト ユーザーに提⽰する画像の 候補がいくつかあり、どの 画像がもっとも良いか知り たいケース 対照群 (Control) と 介⼊群 (Treatment) を⽐較 適当なところで実験を打ち 切り、もっとも成績の良い ものを採⽤する Image from Netflix Technology Blog https://netflixtechblog.com/selecting- the-best-artwork-for-videos-through-a-b-testing-f6155c4595f6

Slide 8

Slide 8 text

複数要素が変化する A/B テスト タイトル画像と背景画像の2 要素がある A/B テスト この場合でも通常通り Control / Treatment でテス トを⾏えば良い ⼀度に複数の要素を変えて テストすると結果がわかり にくくなる Images from https://about.netflix.com/en/news/the-power-of-a-picture

Slide 9

Slide 9 text

課題: 重要な要素は何か? 画像を変えることとタイトルを変えることの どちらが重要か? 特定の背景画像はタイトルよりも影響が⼤き かったかもしれないが全体的な傾向は? 背景画像とタイトルロゴのどちらに予算をか けるべきか? 上記の問いは1回の A/B テストでは解決しない が、どのように計測すれば良い? Images from https://about.netflix.com/en/news/the-power-of-a-picture

Slide 10

Slide 10 text

TOC 問題設定: 繰り返しのある A/B テスト 実験デザインによる解析⼿法の違い <- 分散分析とそのマーケティングへの応⽤ 構造解析とそのマーケティングへの応⽤ 構造解析とベイズモデリング・因果探索 それぞれの解析⼿法の利⽤⽅法 議論 まとめ

Slide 11

Slide 11 text

実験デザインと統計解析 実験デザインとは 実験デザインで解決したい課題 A/Bテストの実験デザイン 要因と⽔準の混同に注意 マーケティングにおける実験デザイン

Slide 12

Slide 12 text

実験デザインとは 実験をデザインするとは、とったデータの 解析に使われる統計法の仕組みを知ること だけではない。それ以上に、科学的なもの の考え⽅を学ぶことである。⾃分のデータ に⾃信を持つことである。⾃分が測ってい ると思っているものを本当に測っていると 知っていることである。 from ⽣命科学の実験デザイン 第4版

Slide 13

Slide 13 text

実験デザインで解決したい課題 失敗を未然に防ぐため、次の事項について検討して実験を計画する 検証したい業務上の仮説 データの収集⽅法 データの集計⽅法 データに⽤いる統計⼿法 データから意思決定する内容やその基準 データの収集で失敗しがちなので、ここを事前に検討する事が重要

Slide 14

Slide 14 text

A/Bテストの実験デザイン A/B テストは1因⼦2⽔準の実験デザイン 因⼦: 実験で着⽬している結果を作⽤する要素、変数 ⽔準: この実験における因⼦が取りうる値 結果は次のような表にまとめられ、検定はt検定を⽤いる Push通知(因⼦) 対象⼈数 CV数 CVR あり (⽔準) 1,000 20 2.0% なし (⽔準) 1,000 10 1.0%

Slide 15

Slide 15 text

因⼦と⽔準の混同に注意 (1/2) 複雑な実験を⾏おうとすると、変更している対象が因⼦に相当するのか ⽔準に相当するのかわかりにくくなる 複雑なデザインで起こってくる問題は、異なる因⼦とそのレベルの混同 である。(中略)ブランドの異なる5つの液体肥料を使って実験をすると したらどうだろう。今度はそれほどはっきりしないのではないだろう か。5つの液体肥料は異なる因⼦なのだろうか、それとも同⼀の因⼦の 異なるレベルなのだろうか。 -- ⽣命科学の実験デザイン 第4版 p.180

Slide 16

Slide 16 text

因⼦と⽔準の混同に注意 (2/2) 肥料AとBを独⽴に使う場合 : 肥料Aと肥料Bの使⽤を因 ⼦として扱う 肥料AとBを独⽴に使わない 場合 : 肥料のブランドという 因⼦の⽔準として肥料Aと肥 料Bを扱う

Slide 17

Slide 17 text

マーケティングにおける 実験デザイン リサーチデザインと呼ばれ ている 左: マーケティングのために 統計をかじってみたい⼈向 けの⼊⾨書籍 右: 統計や因果推論をマーケ ティングに応⽤してみたい ⼈向けの⼊⾨書籍

Slide 18

Slide 18 text

TOC 問題設定: 繰り返しのある A/B テスト 実験デザインによる解析⼿法の違い 分散分析とそのマーケティングへの応⽤ <- 構造解析とそのマーケティングへの応⽤ 構造解析とベイズモデリング・因果探索 それぞれの解析⼿法の利⽤⽅法 議論 まとめ

Slide 19

Slide 19 text

分散分析とそのマーケティングへの応⽤ A/Bテストを繰り返す実験デザイン 分散分析についての資料 分散分析とマーケティング 品質管理への応⽤ 分散分析の利点・⽋点

Slide 20

Slide 20 text

A/Bテストを繰り返す実験デザイン (1/2) Push 通知の画像の有無と2つのメッセージを同時に試したい場合 因⼦1. 画像の有無、ありとなしの2⽔準 因⼦2. メッセージの種類、今回は2種類なので2⽔準 CVR の⽐較表 メッセージ1 (因⼦2の⽔準1) メッセージ2 (因⼦2の⽔準1) 画像あり(因⼦1の⽔準1) CVR 2.0% CVR 1.5% 画像なし(因⼦1の⽔準2) CVR 1.2 CVR 1.0%

Slide 21

Slide 21 text

A/Bテストを繰り返す実験デザイン (2/2) このような集計では「何が結果に寄与したのか」を分析可能 「重要な変数を変えると結果が⼤きく変わる=分散⼤」と考える イメージは次の式のとおり 全体の分散= 画像による分散+ メッセージによる分散 + 組み合わせによる分散+ 残りの分散( 残差) メッセージを変更することや、画像を変更することにより全体に与える 影響を分析する⼿法を分散分析と呼ぶ

Slide 22

Slide 22 text

分散分析とマーケティン グ (1/2) 3群以上の⽐較を⾏う場合の ⼿法として紹介される 右は「1からのマーケティン グ分析 (碩学社 2011)」の⽬ 次から抜粋 1からのマーケティング分析 - 恩藏直⼈・冨⽥健司(編著) | 碩学舎

Slide 23

Slide 23 text

分散分析とマーケティン グ (2/2) マーケティングにおける実 験デザインの重要性が主張 されている リサーチデザインの考え⽅ によると経営学ではリサー チデザインと呼ばれている 様⼦ 1からのマーケティング分析 - 恩藏直⼈・冨⽥健司(編著) | 碩学舎

Slide 24

Slide 24 text

分散分析の利点・⽋点 因⼦が結果を左右する度合 いがわかる ⼀度で複数の因⼦の効果に ついて分析できる 交互作⽤の強さがわかる 結果の⾒⽅が複雑 実験そのものも複雑 from ⽇科技連 実験計画法-⽅法編- ⼭⽥秀 p.84

Slide 25

Slide 25 text

補⾜. 交互作⽤ 分散分析では、因⼦の主効 果と交互作⽤を分けて考え る 実験結果が因⼦の主効果の ⾜し合わせで説明できない ときに、交互作⽤があると いう images from 7.3 交互作⽤とは?

Slide 26

Slide 26 text

品質管理への応⽤ (1/2) 分散分析は品質管理、とく にタグチメソッドに応⽤さ れる 左: 実務への応⽤として品質 管理への適⽤を紹介 右: 分散分析とタグチメソッ ド(タグチの式)の間の理論的 な関係について紹介

Slide 27

Slide 27 text

品質管理への応⽤ (1/2) ⼿順は次の通り i. ⽬的の設定 ii. 因⼦の列挙 (右図) iii. ⽔準の設定 iv. 実験 v. 結果の確認 & 考察 製造業では環境を制御でき るため因⼦を特定でき相性 が良いと思われる

Slide 28

Slide 28 text

分散分析についての資料 ハンバーガー統計学にようこそ! たぶんこれが⼀番簡単だと思います

Slide 29

Slide 29 text

TOC 問題設定: 繰り返しのある A/B テスト 実験デザインによる解析⼿法の違い 分散分析とそのマーケティングへの応⽤ 構造解析とそのマーケティングへの応⽤ <- 構造解析とベイズモデリング・因果探索 それぞれの解析⼿法の利⽤⽅法 議論 まとめ

Slide 30

Slide 30 text

構造解析とそのマーケティングへの応⽤ 分散分析と線形回帰 分散分析と因⼦解析 因⼦解析の例 分散分析と構造解析 (SEM;構造⽅程式モデリング) マーケティングへの応⽤例 共分散構造解析と品質管理 共分散構造解析の限界

Slide 31

Slide 31 text

分散分析と線形回帰 分散分析では線形モデルを 仮定 ⽬的変数を各因⼦と相互作 ⽤項で説明するように線形 回帰 右図はモデルの例 from ⽇科技連 実験計画法-⽅法編- ⼭⽥秀 p.77

Slide 32

Slide 32 text

分散分析と因⼦解析 因⼦分析は代表的にはアンケート結果の解釈に⽤いられる 分散分析では因⼦やその⽔準を実験条件として明⽰的に指定し、⽬的変 数の値が実験条件ごとにさまざまに与えられる 因⼦分析では因⼦はさまざまな観測変数の背後に現れる、共通したあ構 造として捉えられる 操作としては、アンケート結果を分散が最⼤になるよう、主成分分析す ることに近い (が、主成分分析に同じと⾔うと怒られる)

Slide 33

Slide 33 text

補⾜: 主成分分析と因⼦ 解析の類似点と相違点 類似点 ともに共分散⾏列を説明 相違点 因果の⽅向 (右図) 誤差項の有無 from 主成分分析は因⼦分析ではない!

Slide 34

Slide 34 text

因⼦分析の例 (1/2) ⽇経リサーチの「ブランド 戦略サーベイ」における分 析例 アンケートで「そう思う」 と回答された割合を「企業 数×25項⽬」の⾏列に集計 し、因⼦分析 image from 因⼦分析 | ⽇経リサーチ

Slide 35

Slide 35 text

因⼦分析の例 (2/2) 分析結果は⼈が意味づけ 因⼦1. のれん 因⼦2. 活性⼒ 因⼦3. ⼤衆性 因⼦4. 先鋭性 因⼦の数やそれぞれの因⼦ の意味付けには強い仮説が 必要 image from 因⼦分析 | ⽇経リサーチ

Slide 36

Slide 36 text

分散分析と共分散構造解析 分散分析で⽤いている線形モデルを⾃分で設計できるようにしたのが構 造解析 線形モデルに階層構造を導⼊したり、モデルに制約を加えたりして、分 析者の知識を外挿する技法 探索的なものと記述的なもので、⼤きく結果の解釈⽅法が違う 共分散構造解析は SEM;構造⽅程式モデリング とも呼ばれる

Slide 37

Slide 37 text

補⾜: 外挿と内挿 内挿: データのある区間につ いて出⼒を推定 外挿: データのない区間につ いて出⼒を推定 外挿の例: Moore の法則 外挿のためにモデルへ制約 を加えることがある 右図は単調性を加えた例 image from TensorFlow Lattice (TFL)

Slide 38

Slide 38 text

マーケティングへの応⽤ 例 (1/4) 共分散構造解析を⽤いた顧 客満⾜度分析 ⽇本⽣産性本部が定期的に 発表 from 2020年度第1回JCSI調査発表⽂

Slide 39

Slide 39 text

マーケティン グへの応⽤例 (2/4) 全 110 問のア ンケート調査 回答者数約 27,000 ⼈ 設問構成は右 のとおり from 2020年度第1回調査詳細資料

Slide 40

Slide 40 text

マーケティン グへの応⽤例 (3/4) 顧客の⼼理状 態を表すCSIモ デルに従いア ンケートを設 計 各設問は10段 階評価 from 2020年度第1回調査詳細資料

Slide 41

Slide 41 text

マーケティン グへの応⽤例 (4/4) アンケート結 果からパス図 を作成 ⼩野 譲司 JCSIによる顧客満⾜モデルの構築 マーケティ ングジャーナル 30(1), 20-34, , ⽇本マーケティング協 会, 2010

Slide 42

Slide 42 text

共分散構造解析とその他 の⼿法 パス図を⽤いると⽐較的わ かりやすく区別可能 上図 パス解析 | ⽇経リサーチ 下図

Slide 43

Slide 43 text

共分散構造解 析と品質管理 意外と活⽤は 進んでいない 様⼦ 「潜在変数」 の考え⽅がな じまないのか もしれない from よくある質問 - 品質管理なら⽇本科学技術連盟

Slide 44

Slide 44 text

共分散構造解析の限界 結果がモデルに⼤きく依存する モデルが正しいかどうかを確かめる⼿段はな い (All models are wrong - Wikipedia) しかし、実は、構造推定にはそれ以前に重⼤ な短所がある。それは、⾃然実験に⽐べる と、内的妥当性に劣る、という点だ。 -- from 実証分析⼊⾨ ⽇本評論社 p.242

Slide 45

Slide 45 text

TOC 問題設定: 繰り返しのある A/B テスト 実験デザインによる解析⼿法の違い 分散分析とそのマーケティングへの応⽤ 構造解析とそのマーケティングへの応⽤ 構造解析とベイズモデリング・因果探索 <- それぞれの解析⼿法の利⽤⽅法 議論 まとめ

Slide 46

Slide 46 text

構造解析とベイズモデリング・因果探索 共分散構造解析と因果関係 構造解析とベイズモデリング 構造解析と因果探索

Slide 47

Slide 47 text

共分散構造解析と因果関係 共分散構造解析では因果関係を考慮できる点が優位とされている Q. 構造⽅程式モデリングを実践すると、観察データの因果関係を定量的 に評価・解釈できると聞きました。構造⽅程式モデリングとは何です か? A. 「構造⽅程式モデリング」(「共分散構造分析」とも呼ばれます。以 下,SEM)は、多変量解析⼿法の1つであり、観察データに基づいて変 数間の因果関係を定量的に評価・解釈できることが特徴です。 -- from よくある質問 - 品質管理なら⽇本科学技術連盟

Slide 48

Slide 48 text

構造解析とベイズモデリング 階層ベイズモデルの特殊系が共分散構造解析 (SEM) 確率分布は(多次元)正規分布のみ 確率変数間の関係は線形結合のみ 階層ベイズモデルを扱える Stan で SEM は実 装できる Stanで構造⽅程式モデリングをやってみ た | Sunny side up!

Slide 49

Slide 49 text

構造解析と因果探索 (1/2) 因果グラフ (DAG) を線形モデルで表現すると、因果効果の推定が実⾏で きる 前提 ⽬的 ⼿法 因果グラフが既知 因果効果の推定 SEM 因果グラフが既知 因果関係の強さの推定 SEM 因果グラフが部分的に既知 因果効果の推定 因果推論 因果グラフが未知 因果グラフの推定 因果探索

Slide 50

Slide 50 text

構造解析と因果探索 (2/2) 分散分析では因⼦間の相関 はわかるものの、因果関係 の⽅向はわからない SEMでは因果関係の正しさ の保証が困難 LiNGAM では制約を課した 線形モデルを⽤いて因果関 係を識別する from 因果探索: 基本から最近の発展までを概説

Slide 51

Slide 51 text

TOC 問題設定: 繰り返しのある A/B テスト 実験デザインによる解析⼿法の違い 分散分析とそのマーケティングへの応⽤ 構造解析とそのマーケティングへの応⽤ 構造解析とベイズモデリング・因果探索 それぞれの解析⼿法の利⽤⽅法 <- 議論 まとめ

Slide 52

Slide 52 text

それぞれの解析⼿法の利⽤⽅法 t検定・分散分析: statsmodels パス分析・構造⽅程式モデリング : semopy 階層ベイズ: たくさんある 因果探索: LiNGAM, causalnex

Slide 53

Slide 53 text

statsmodels OLS で分散分析を実⾏でき る formula = 'S ~ C(E) + C(M) + X' lm = ols(formula, salary_table).fit() tutorial は Interactions and ANOVA — statsmodels

Slide 54

Slide 54 text

semopy # structural part eta3 ~ x1 + x2 eta4 ~ x3 x3 ~ eta1 + eta2 + x1 + x4 x4 ~ eta4 x5 ~ x4 # measurement part eta1 =~ y1 + y2 + y3 eta2 =~ y3 eta3 =~ y4 + y5 eta4 =~ y4 + y6 # additional covariances eta2 ~~ x2 y5 ~~ y6

Slide 55

Slide 55 text

階層ベイズに使えるライブラリの例 PyMC4 PyMC4 で単回帰 (ただしベイズ) @pm.model def model(data): mu = yield pm.Normal(loc=0, scale=10, name="mu") sig = yield pm.Exponential(rate=0.1, name="sig") like = yield pm.Normal(loc=mu, scale=sig, observed=data, name="like") return like estimation_model = model(data) trace = pm.sample(model(data), num_samples=800) 最近の事情は近年の PPL の動向 が詳しい

Slide 56

Slide 56 text

LiNGAM 統計的因果探索⽤ライブラリ model = lingam.DirectLiNGAM() model.fit(X) make_dot(model.adjacency_matrix_) 機能追加やメンテナンスがされてい る (重要) from lingam/DrawGraph.ipynb

Slide 57

Slide 57 text

causalnex 統計的因果探索⽤ライブラリ sm = from_pandas(struct_data) sm.remove_edges_below_threshold(0.8) viz = plot_structure( sm, graph_attributes={"scale": "0.5"}, all_node_attributes=NODE_STYLE.WEAK, all_edge_attributes=EDGE_STYLE.WEAK) Image(viz.draw(format='png')) LiNGAM に⽐べると後進なものの、 投資は進んでいる模様 from A first CausalNex tutorial — causalnex 0.8.1 documentation

Slide 58

Slide 58 text

TOC 問題設定: 繰り返しのある A/B テスト 実験デザインによる解析⼿法の違い 分散分析とそのマーケティングへの応⽤ 構造解析とそのマーケティングへの応⽤ 構造解析とベイズモデリング・因果探索 それぞれの解析⼿法の利⽤⽅法 議論 <- まとめ

Slide 59

Slide 59 text

議論 なぜ実験デザインは現代の機械学習勢やマーケターに伝わってきていな いのか? 考察 理論⾯からの考察 ゴシップ⾯からの考察 根拠は乏しいです

Slide 60

Slide 60 text

理論⾯からの考察 分析者に要求される前提が厳しすぎたのでは? 実験デザインは (アカデミアを除いて) 次のように伝播している 製造業: 実験デザイン→タグチメソッド (分散分析) マーケティング: 実験デザイン→アンケート分析 (SEM) 上記の⼿法はどちらも、データの⽣成過程に理論的な知識が必要 Big Data の時代が到来し「相関だけでいいんだよ」という世論に 機械学習の時代が到来し「因果関係はわからなくてもデータさえあれば 再現できる」という世論に 上記の結果、失伝したのでは?

Slide 61

Slide 61 text

ゴシップ⾯からの考察 因果推論の⼿法を⽤いる⾃然実験派と構造推 定の⼿法を⽤いる構造推定派は仲が悪い 現在流⾏しているのは RCT のような実験デザ インを必要としない⾃然実験 実証分析のスーパースターたちが互いに⼝汚 く罵り合っていて、「うわ、こいつらめっち ゃ仲悪い、絶対和解できないだろうな」と感 じることだろう。 -- from 実証分析⼊⾨ ⽇本評論社 p.241

Slide 62

Slide 62 text

TOC 問題設定: 繰り返しのある A/B テスト 実験デザインによる解析⼿法の違い 分散分析とそのマーケティングへの応⽤ 構造解析とそのマーケティングへの応⽤ 構造解析とベイズモデリング・因果探索 それぞれの解析⼿法の利⽤⽅法 議論 まとめ <-

Slide 63

Slide 63 text

まとめ A/B テストを繰り返す実験の分析には分散分析が⽤いられる 分散分析では、要因間の関連について分析を⾏う 分散解析では現実を把握し実験する必要があり、実験環境の統制を⾏い やすい製造業、とくに品質管理で発展している 共分散構造解析では、分析者の知識をモデルとして与えることができ、 アンケートの結果分析に利⽤される マーケティングへ共分散構造解析を応⽤するためには⼈のモデル化が必 要なため、単純な A/B テストよりも分析者に知識が要求される さらなる発展には因果関係をデータから発⾒する因果探索がある

Slide 64

Slide 64 text

参考にした書籍

Slide 65

Slide 65 text

実験デザイン ⽣命科学の実験デザイン[第4版]G. D. ラクストン/N. コルグレイヴ 著 名古屋⼤学出版会 2019年 1からのマーケティング分析 - 恩藏直⼈・冨⽥健司(編著)碩学舎 2011 年 実験計画法-⽅法編- ⼭⽥ 秀著 ⽇科技連出版社 2004年 ⼊⾨ 実験計画法 永⽥ 靖著 ⽇科技連出版社 2000年

Slide 66

Slide 66 text

共分散構造解析 (1/2) 共分散構造分析[⼊⾨編] ― 構造⽅程式モデリング― 豊⽥ 秀樹著 朝倉 書店 1998年 共分散構造分析[応⽤編] ― 構造⽅程式モデリング― 豊⽥ 秀樹著 朝倉 書店 2000年 共分散構造分析[技術編] ― 構造⽅程式モデリング― 豊⽥ 秀樹編著 朝 倉書店 2003年 共分散構造分析[疑問編] ― 構造⽅程式モデリング― 豊⽥ 秀樹編著 朝 倉書店 2003年

Slide 67

Slide 67 text

共分散構造解析 (2/2) 共分散構造分析[理論編] ― 構造⽅程式モデリング― 豊⽥ 秀樹著 朝倉 書店 2007年 新装版 共分散構造分析はじめの⼀歩: 図の意味から学ぶパス解析⼊⾨ ⼩ 塩 真司著 アルテ 2020年 実証分析⼊⾨ 森⽥ 果著 ⽇本評論社 2014年