再帰化への認知的転回/the-turn-to-recursive-system

Slide 1

Slide 1 text

再帰化への認知的転回三宅悠介 / GMO PEPABO inc. 2022.03.11 ペパボテックカンファレンス 1

Slide 2

Slide 2 text

1. 再帰化の定義 2. 関数の設計から系の設計へ 3. 多様かつ継続的に変化する系の設計の難しさ 4. 複雑な系の導入における機会損失の考慮 5. そして再帰化へ 6. まとめ: 再帰化となめらかなシステム・個人的考察 2 アジェンダ

Slide 3

Slide 3 text

1. 再帰化の定義 3

Slide 4

Slide 4 text

「再帰化」とは、構造化・自動化されたサービスが、ユーザとのインタラクションの結果を取り込んで、システムを自らより良いものへと改修していくプロセスのことをいいます。[*] 4 再帰化 [*] CTOメモ: 2022年のテクノロジー方針（社内資料より）

Slide 5

Slide 5 text

2. 関数の設計から系の設計へ 5

Slide 6

Slide 6 text

従来のシステム開発では、利用者からの入力 xに対してシステムの出力yを決定する関数fを設計している。 = 再帰化の定義における「構造化・自動化されたサービス」に該当する部分に該当関数の設計から系の設計へ 6 従来のシステム開発を「関数の設計」として捉える

Slide 7

Slide 7 text

運用者の経験に基づく設計は、必ずしも利用者の要望を反映しているとは限らない。また、認知負荷の観点から利用者の要望に対する最大公約数的な振る舞いを選定しがちである。加えて、実装面では、要望の反映までに時間がかかるという課題もある。関数の設計から系の設計へ 7 人手による「関数の設計」の課題

Slide 8

Slide 8 text

関数の設計から系の設計へ 8 機械学習は「関数の設計」を自動化する（データからパラメータを求める） ① 入出力の対応関係を定義 ② 予測に対するズレを定義 ③ 学習データに対する予測のズレを最小化する ④ パラメータが決まる（データから関数の設計ができた）

Slide 9

Slide 9 text

● 機械学習を用いたデータに基づく設計は（モデリングが正しければ）利用者の要望を正しく、かつ、個別的に反映している（可能性が高い） ● 一方で、（機械学習に限らず）設計された関数は、ある時点までのデータに基づく振る舞いを行う（内挿性） ● サービスを取り巻く環境は継続的に変化していると考えられるため、関数の継続的な再設計が必要（外挿の考慮）関数の設計から系の設計へ 9 機械学習による「関数の設計」の課題

Slide 10

Slide 10 text

● ある時点で有効な関数をサービスや利用者の環境の変化に応じて継続的に再設計（あるいは別関数への置き換え）を行う系全体の仕組みを設計する ○ 再帰化の定義における「ユーザーとのインタラクションの結果を取り込んで、システムを自らより良いものへと改修していくプロセス」の部分に該当関数の設計から系の設計へ 10 「関数の継続的な再設計」を可能とする「系の設計」へ（メタァ〜） Activity Controller

Slide 11

Slide 11 text

● 従来のサービス運用維持はこのサイクルを人手で回していた ○ 経験から関数の設計（適切性の課題） ○ エンジニアによる関数の再実装（追従性の課題） ● 再帰化では、フィードバックとシステムの挙動変更をシステム総体のうちに組み込む関数の設計から系の設計へ 11 「関数の継続的な再設計」を可能とする「系の設計」へ（メタァ〜） Activity Controller

Slide 12

Slide 12 text

「再帰化」とは、構造化・自動化されたサービスが、ユーザとのインタラクションの結果を取り込んで、システムを自らより良いものへと改修していくプロセスのことをいいます。[*] 12 再帰化つまりそういうことなんですよ  [*] CTOメモ: 2022年のテクノロジー方針（社内資料より）

Slide 13

Slide 13 text

3. 多様かつ継続的に変化する系の設計の難しさ 13

Slide 14

Slide 14 text

• この系における最大の困難は、限られたインタラクションから利用者の背景や要求を類推しなければならない点である。 • 閲覧、コンバージョン、利用者の基本属性、文脈、アップロードした商品データ等々 • 1. インタラクションの保存 • インタラクションが保存されていることが系の前提。 • 2. インタラクションの解釈 • 背景や要求は利用者ごとに多様である • この系の導入前提から時間的な変化を考慮する必要がある多様かつ継続的に変化する系の設計の難しさ 14 1. インタラクションの解釈

Slide 15

Slide 15 text

• データ基盤Bigfoot[*]のススメ • インタラクションの保存と解釈のシステム基盤としては Bigfootが良いと思います（宣伝） • Google BigQueryにより、サービスの膨大な履歴を格納、検索が可能 • Google Vertex AIにより、集計や機械学習モデリングが実現可能 • データ処理パイプラインによりこれらの継続的な更新が実現可能 • インタラクションの個別かつ最適な解釈には機械学習の導入が有用 • 必ずしも機械学習を用いなくとも、平均のようなシンプルな集計や既知のグルーピングによる粒度の大きい個別化から始めても大丈夫です • 最適な機械学習モデルの検討はペパ研とデータ基盤チームでもガンガンやっていきます • 興味ある方、一緒にやりましょう多様かつ継続的に変化する系の設計の難しさ 15 1. インタラクションの解釈 [*] GMOペパボのサービスと研究開発を支えるデータ基盤の裏側

Slide 16

Slide 16 text

• 利用者の背景や要求を把握するために、利用者から明示的に状態を教えてもらうのは利便性の低下につながる • 画面遷移ごとに「今、これ買いたい感じ？」とかは聞けない • 必要最小限のインタラクションから暗黙的なフィードバックを得ることが望ましい • セッションを個別に特定できる仕組み • インタラクションに纏わる情報 • 閲覧時間、スクロール速度、画面内の配置順序、ページング番号など多様かつ継続的に変化する系の設計の難しさ 16 2. 利便性とのトレードオフ

Slide 17

Slide 17 text

• 暗黙的なフィードバックから機械学習などで利用者の背景や要求を解釈した上で、システムは振る舞いを変更するところまでが再帰化 • 再設計した関数に即時切り替え可能か • 比較評価と自動かつ継続的な切り替えが必要 • 突発的な変化を検知可能だったとして、システムが即時振る舞いを変更できるか • ホスティングにおけるアクセスの急激な増加 • ECサイトにおける購買モードの変化 • オートスケーリングや導線の動的な変更、現状の状況に重み付けした挙動変更の機構が必要多様かつ継続的に変化する系の設計の難しさ 17 3. 背景や要求にもとづき振る舞い変更する仕組みが必要

Slide 18

Slide 18 text

4. 複雑な系の導入における機会損失の考慮 18

Slide 19

Slide 19 text

• 再帰化はあくまで利用者の要求や背景をもとにシステムが動的に変化していくアーキテクチャであり、この上で実行される施策（ =関数）が全て成功するわけではない • 利用者の要求や背景を解釈して最適な挙動に切り替えるってとても難しいことです • しかしながら、再帰化の仕組みに乗ることで施策の評価、切り替えが人手を介さずに実行できるため、数多くの施策を比較評価できるという点が重要である • 一方で、実環境での施策の評価には機会損失が避けられない • 短期的には効果の低い施策を使うことによる機会損失 • 中長期的には、施策の有効性を見誤ることによる機会損失複雑な系の導入における機会損失の考慮 19 全部の施策が当たると思ってはいけない

Slide 20

Slide 20 text

• 複数の施策を正しく無駄なく比較評価するためには統計的仮説検定が有用 • 得られたサンプル数から有用性の差がある（ない）ことを確信できるか • A/Bテストと組み合わせると効果的 • 一方でここに人手が介在すると、切り替えが自動で行われないという問題が発生する • 統計的な判断に基づき、良さそうな施策を多く利用しつつ、全体の施策に対して最低限のサンプルを収集するような仕組みが求められる • 多腕バンディットの利用 • 導入には、多腕バンディットで始めるデータ駆動（社内資料）を参考のこと • データ基盤Bigfootではbigfoot-bandit gemを使うことでサービスへの導入が容易（宣伝） • 再帰化の要件を考慮した多腕バンディットのアルゴリズムもペパ研で絶賛研究中です複雑な系の導入における機会損失の考慮 20 機会損失の低減に向けて

Slide 21

Slide 21 text

5. そして再帰化へ 21

Slide 22

Slide 22 text

Analyzer Tokenizer 22 検索における再帰化候補の列挙 minneの検索コンポーネント（現状） Index Char Filter(s) Token Filter(s) Analyzer ML Model Feature Extraction Classifier Matcher Sorter Query Doc Feedback Response ?

Slide 23

Slide 23 text

Analyzer Tokenizer 23 検索における再帰化候補の列挙 minneの検索コンポーネント（再帰化） Index Char Filter(s) Token Filter(s) Analyzer ML Model Feature Extraction Classifier Matcher Sorter Query Doc Feedback Bigfoot Activity Controller Response なお本図は『AIアルゴリズムマーケティング』の「図4-33: マーチャンダイジング検索サービスの主要な論理的要素」をもとに minne構成ならびに「なめらかなシステム」の要素を踏まえ再構成した

Slide 24

Slide 24 text

24 検索における再帰化候補の列挙 minne検索システムの再帰化の候補 • 以下、社内向けの具体的な施策候補（社内資料として省略）

Slide 25

Slide 25 text

6. まとめ再帰化となめらかなシステム・個人的考察 25

Slide 26

Slide 26 text

• 「再帰化」の取り組みに必要な関数の設計から系の設計へという認知的転回を与えた • 「再帰化」の取り組みは、実はペパボ研究所における「なめらかなシステム」の実現に向けた取り組みに他ならない • 本資料の 2. 項と 3. 項は、すべて「なめらかなシステム」の要件にもとづく • 「なめらかなシステム」は、利用者と運用者、システムを等価に扱うことが可能 • また、それらを「自律的」（外部からは入出力の関係性を類推する他ない存在）であることを前提に、より挑戦的な課題としてシステムの実現を目指す • なめらかなシステムの見据えるもの。個人的考察 - THINKING MEGANE - まとめ 26 再帰化となめらかなシステム・個人的考察

Slide 27

Slide 27 text

27 Thank You! Thank You!