Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
再帰化への認知的転回/the-turn-to-recursive-system
monochromegane
April 01, 2022
Research
0
310
再帰化への認知的転回/the-turn-to-recursive-system
2022.03.11 ペパボテックカンファレンス
monochromegane
April 01, 2022
Tweet
Share
More Decks by monochromegane
See All by monochromegane
迅速な学習機構を用いて逐次適応性を損なうことなく非線形性を扱う文脈付き多腕バンディット手法/extreme_neural_linear_bandits
monochromegane
0
230
仮想的な探索を用いて文脈や時間の経過による番狂わせにも迅速に追従する多腕バンディット手法/wi2_lkf_bandits
monochromegane
0
320
Synapse: 文脈と時間経過に応じて推薦手法の選択を最適化するメタ推薦システム/smash21-synapse
monochromegane
0
240
なめらかなシステムと運用維持の未来/dicomo2021-coherently-fittable-system
monochromegane
1
9.6k
go:embedでExplainable Binaryを作る/fukoukago17_go_code_embedding
monochromegane
2
180
非定常な多腕バンディット問題において効率的に変化を察知する方式の検討/wsa8_predictive_exploratory_model
monochromegane
0
2.2k
変化検出と要約データ構造を用いた利用者の嗜好の変化に迅速に追従する多腕バンディット手法/iots2020-adaptive-linear-mab
monochromegane
0
620
嗜好伝達コミュニケーションの効率化を目指した伝達方式の検討/wsa7_local_preference
monochromegane
0
2.6k
なめらかなシステムの実現に向けて/coherently-fittable-system
monochromegane
0
320
Other Decks in Research
See All in Research
[RecSys2022論文読み会]Bundle MCR: Towards Conversational Bundle Recommendation
okukenta
PRO
0
130
Self-Supervised Learning
naok615
4
2.5k
第21回チャンピオンズミーティング・カプリコーン杯ラウンド2集計 / Umamusume Capricorn 2023 Round2
kitachan_black
0
450
動画像を入力とした深度推定のHW/SW協調設計によるFPGAベースの高速化手法 (ARC 2022/10)
hashi0203
0
230
[輪講資料] Optimus: Organizing Sentences via Pre-trained Modeling of a Latent Space
hpprc
0
880
CNNによる画像認識の基礎
sgnm
0
120
RecSys2022 論文読み会 | 【紹介】Tutorial: Psychology-informed Recommender Systems
zerebom
0
440
機械学習と機械発見:自然科学研究におけるデータ利活用の再考
itakigawa
4
1.8k
【西多摩電波調査】調査報告書
5g_digitalservicetmg
0
310
OLM R&D祭 2022 10/19 タップ穴補正・作画トレースツール紹介 +”作画ツール”共同開発中!
olmdrd
PRO
0
810
小1にルービックキューブを教えてみた 〜群論スポーツの教育とパターン認知〜
itakigawa
0
140
Optimizing Electric Journal Subscriptions via Integer Programs
umepon
0
370
Featured
See All Featured
Writing Fast Ruby
sferik
613
58k
Become a Pro
speakerdeck
PRO
6
3.2k
Six Lessons from altMBA
skipperchong
15
2.3k
Fashionably flexible responsive web design (full day workshop)
malarkey
396
63k
Gamification - CAS2011
davidbonilla
75
4.1k
Debugging Ruby Performance
tmm1
67
11k
Large-scale JavaScript Application Architecture
addyosmani
499
110k
Teambox: Starting and Learning
jrom
124
7.9k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
109
16k
Faster Mobile Websites
deanohume
295
29k
How to Ace a Technical Interview
jacobian
270
21k
We Have a Design System, Now What?
morganepeng
37
6k
Transcript
再帰化への認知的転回 三宅 悠介 / GMO PEPABO inc. 2022.03.11 ペパボテックカンファレンス 1
1. 再帰化の定義 2. 関数の設計から系の設計へ 3. 多様かつ継続的に変化する系の設計の難しさ 4. 複雑な系の導入における機会損失の考慮 5. そして再帰化へ
6. まとめ: 再帰化となめらかなシステム・個人的考察 2 アジェンダ
1. 再帰化の定義 3
「再帰化」とは、構造化・自動化されたサービ スが、ユーザとのインタラクションの結果を取 り込んで、システムを自らより良いものへと改 修していくプロセスのことをいいます。[*] 4 再帰化 [*] CTOメモ: 2022年のテクノロジー方針(社内資料より)
2. 関数の設計から系の設計へ 5
従来のシステム開発では、利用者からの入力 xに対してシステムの出力yを決定する関数fを設 計している。 = 再帰化の定義における「構造化・自動化されたサービス」に該当する部分に該当 関数の設計から系の設計へ 6 従来のシステム開発を「関数の設計」として捉える
運用者の経験に基づく設計は、必ずしも利用者の要望を反映しているとは限らない。 また、認知負荷の観点から利用者の要望に対する 最大公約数的な振る舞いを選定しがちであ る。 加えて、実装面では、要望の反映までに 時間がかかるという課題もある。 関数の設計から系の設計へ 7 人手による「関数の設計」の課題
関数の設計から系の設計へ 8 機械学習は「関数の設計」を自動化する(データからパラメータを求める) ① 入出力の対応関係を定義 ② 予測に対するズレを定義 ③ 学習データに対する予 測のズレを最小化する
④ パラメータが決まる (データから関数の設計ができた)
• 機械学習を用いたデータに基づく設計は(モデリングが正しければ)利用者の要望を正しく、か つ、個別的に反映している(可能性が高い) • 一方で、(機械学習に限らず)設計された関数は、ある時点までのデータに基づく振る舞いを行う (内挿性) • サービスを取り巻く環境は継続的に変化していると考えられるため、関数の継続的な再設計が必 要(外挿の考慮) 関数の設計から系の設計へ
9 機械学習による「関数の設計」の課題
• ある時点で有効な関数をサービスや利用者の環境の変化に応じて継続的に再設計(あるいは別 関数への置き換え)を行う系全体の仕組みを設計する ◦ 再帰化の定義における「ユーザーとのインタラクションの結果を取り込んで、システムを自らより良い ものへと改修していくプロセス」の部分に該当 関数の設計から系の設計へ 10 「関数の継続的な再設計」を可能とする「系の設計」へ(メタァ〜) Activity
Controller
• 従来のサービス運用維持はこのサイクルを人手で回していた ◦ 経験から関数の設計 (適切性の課題) ◦ エンジニアによる関数の再実装 (追従性の課題) • 再帰化では、フィードバックとシステムの挙動変更をシステム総体のうちに組み込む
関数の設計から系の設計へ 11 「関数の継続的な再設計」を可能とする「系の設計」へ(メタァ〜) Activity Controller
「再帰化」とは、構造化・自動化されたサー ビスが、ユーザとのインタラクションの結 果を取り込んで、システムを自らより良い ものへと改修していくプロセスのことをいいま す。[*] 12 再帰化 つまりそういうことな んですよ [*]
CTOメモ: 2022年のテクノロジー方針(社内資料より)
3. 多様かつ継続的に変化する系の 設計の難しさ 13
• この系における最大の困難は、 限られたインタラクションから利用者の背景や要求を類 推しなければならない点である。 • 閲覧、コンバージョン、利用者の基本属性、文脈、アップロードした商品データ等々 • 1. インタラクションの保存 •
インタラクションが保存されていることが系の前提。 • 2. インタラクションの解釈 • 背景や要求は利用者ごとに 多様である • この系の導入前提から 時間的な変化を考慮する必要がある 多様かつ継続的に変化する系の設計の難しさ 14 1. インタラクションの解釈
• データ基盤Bigfoot[*]のススメ • インタラクションの保存と解釈のシステム基盤としては Bigfootが良いと思います(宣伝) • Google BigQueryにより、サービスの膨大な履歴を格納、検索が可能 • Google
Vertex AIにより、集計や機械学習モデリングが実現可能 • データ処理パイプラインによりこれらの継続的な更新が実現可能 • インタラクションの個別かつ最適な解釈には機械学習の導入が有用 • 必ずしも機械学習を用いなくとも、平均のようなシンプルな集計や既知のグルーピングによる粒度 の大きい個別化から始めても大丈夫です • 最適な機械学習モデルの検討はペパ研とデータ基盤チームでもガンガンやっていきます • 興味ある方、一緒にやりましょう 多様かつ継続的に変化する系の設計の難しさ 15 1. インタラクションの解釈 [*] GMOペパボのサービスと研究開発を支えるデータ基盤の裏側
• 利用者の背景や要求を把握するために、利用者から明示的に状態を教えてもらうのは利便性 の低下につながる • 画面遷移ごとに「今、これ買いたい感じ?」とかは聞けない • 必要最小限のインタラクションから暗黙的なフィードバックを得ることが望ましい • セッションを個別に特定できる仕組み •
インタラクションに纏わる情報 • 閲覧時間、スクロール速度、画面内の配置順序、ページング番号など 多様かつ継続的に変化する系の設計の難しさ 16 2. 利便性とのトレードオフ
• 暗黙的なフィードバックから機械学習などで利用者の背景や要求を解釈した上で、システムは 振る舞いを変更するところまでが再帰化 • 再設計した関数に即時切り替え可能か • 比較評価と自動かつ継続的な切り替えが必要 • 突発的な変化を検知可能だったとして、システムが即時振る舞いを変更できるか •
ホスティングにおけるアクセスの急激な増加 • ECサイトにおける購買モードの変化 • オートスケーリングや導線の動的な変更、現状の状況に重み付けした挙動変更の機構が必要 多様かつ継続的に変化する系の設計の難しさ 17 3. 背景や要求にもとづき振る舞い変更する仕組みが必要
4. 複雑な系の導入における 機会損失の考慮 18
• 再帰化はあくまで利用者の要求や背景をもとにシステムが動的に変化していくアーキテクチャ であり、この上で実行される施策( =関数)が全て成功するわけではない • 利用者の要求や背景を解釈して最適な挙動に切り替えるってとても難しいことです • しかしながら、再帰化の仕組みに乗ることで施策の評価、切り替えが人手を介さずに実行でき るため、数多くの施策を比較評価できるという点が重要である •
一方で、実環境での施策の評価には 機会損失が避けられない • 短期的には効果の低い施策を使うことによる機会損失 • 中長期的には、施策の有効性を見誤ることによる機会損失 複雑な系の導入における機会損失の考慮 19 全部の施策が当たると思ってはいけない
• 複数の施策を正しく無駄なく比較評価するためには 統計的仮説検定が有用 • 得られたサンプル数から有用性の差がある(ない)ことを確信できるか • A/Bテストと組み合わせると効果的 • 一方でここに人手が介在すると、切り替えが自動で行われないという問題が発生する •
統計的な判断に基づき、良さそうな施策を多く利用しつつ、全体の施策に対して最低限のサン プルを収集するような仕組みが求められる • 多腕バンディットの利用 • 導入には、多腕バンディットで始めるデータ駆動(社内資料)を参考のこと • データ基盤Bigfootではbigfoot-bandit gemを使うことでサービスへの導入が容易(宣伝) • 再帰化の要件を考慮した多腕バンディットのアルゴリズムもペパ研で絶賛研究中です 複雑な系の導入における機会損失の考慮 20 機会損失の低減に向けて
5. そして再帰化へ 21
Analyzer Tokenizer 22 検索における再帰化候補の列挙 minneの検索コンポーネント(現状) Index Char Filter(s) Token Filter(s)
Analyzer ML Model Feature Extraction Classifier Matcher Sorter Query Doc Feedback Response ?
Analyzer Tokenizer 23 検索における再帰化候補の列挙 minneの検索コンポーネント(再帰化) Index Char Filter(s) Token Filter(s)
Analyzer ML Model Feature Extraction Classifier Matcher Sorter Query Doc Feedback Bigfoot Activity Controller Response なお本図は『AIアルゴリズムマーケティング』の「図4-33: マー チャンダイジング検索サービスの主要な論理的要素」をもとに minne構成ならびに「なめらかなシステム」の要素を踏まえ再構 成した
24 検索における再帰化候補の列挙 minne検索システムの再帰化の候補 • 以下、社内向けの具体的な施策候補(社内資料として省略)
6. まとめ 再帰化となめらかなシステム・ 個人的考察 25
• 「再帰化」の取り組みに必要な関数の設計から系の設計へという認知的転回を与えた • 「再帰化」の取り組みは、実はペパボ研究所における「 なめらかなシステム」の実現に向けた 取り組みに他ならない • 本資料の 2. 項と
3. 項は、すべて「なめらかなシステム」の要件にもとづく • 「なめらかなシステム」は、利用者と運用者、システムを等価に扱うことが可能 • また、それらを「自律的」(外部からは入出力の関係性を類推する他ない存在)であることを前 提に、より挑戦的な課題としてシステムの実現を目指す • なめらかなシステムの見据えるもの。個人的考察 - THINKING MEGANE - まとめ 26 再帰化となめらかなシステム・個人的考察
27 Thank You! Thank You!