Slide 1

Slide 1 text

XX University ウェブ最適化ではじめる機械学習 8章 2021.08 Abeta

Slide 2

Slide 2 text

2 8.1 短期的な評価と⻑期的な評価 8.1.1 リピートユーザを考慮した最適化 8.2 解空間のデザイン 8.3 ウェブサイト以外への応⽤

Slide 3

Slide 3 text

3 8.1 短期的な評価と⻑期的な評価 8.1.1 リピートユーザを考慮した最適化 8.2 解空間のデザイン 8.3 ウェブサイト以外への応⽤

Slide 4

Slide 4 text

4 8.1 短期的な評価と⻑期的な評価 8.1.1 リピートユーザを考慮した最適化 8.2 解空間のデザイン 8.3 ウェブサイト以外への応⽤

Slide 5

Slide 5 text

5 ユーザが⽇常的に使うツールで、ユーザの即時的な反応のみに着⽬すると、⻑期的な収益が下がる場合がある。 例)googleで広告表⽰を多くした→ユーザの使い勝⼿が悪くなり⻑期的には減収。 ⻑期的スパンで計測される指標も考慮する必要あり。 ⻑期的指標の評価には時間がかる。 ⼀つのアプローチとして、短期的な指標・特徴量から⻑期的指標を予測する機械学習モデルを作成することが ある。 𝜃 = 𝛼 + 𝛽! 𝑥"#$%&%'()*% + 𝛽+ 𝑥,()#-)./(.%01()2-23

Slide 6

Slide 6 text

6 8.1 短期的な評価と⻑期的な評価 8.1.1 リピートユーザを考慮した最適化 8.2 解空間のデザイン 8.3 ウェブサイト以外への応⽤

Slide 7

Slide 7 text

7 バンディット問題ではユーザの状態は1つ、すなわち考慮されていなかった。ユーザの⾏動は新規やリピータ といった「状態」によって異なると考えられる。 ユーザの状態を扱う⼀つのアプローチとして強化学習がある。強化学習では最初から状態の遷移確率 𝒫(𝑠4 |𝑠45! )が含まれている。

Slide 8

Slide 8 text

8 8.1 短期的な評価と⻑期的な評価 8.1.1 リピートユーザを考慮した最適化 8.2 解空間のデザイン 8.3 ウェブサイト以外への応⽤

Slide 9

Slide 9 text

9 今回は解空間の検討を⼈間で⾏った(HLS空間、彩度100%)。これは⾊に対する知識を⽤いて暗黙にいくつ かの仮定を置いている。⼈間が思いつかないような選択肢を排除してしまっている。 ⼀⽅で、解空間の制約を無くすと解空間が膨⼤となって問題を解けない。 ⼀つのアプローチとして、解空間を⼩さい空間に圧縮してしまう⽅法がある。具体的には変分オートエンコー ダが使⽤できる。

Slide 10

Slide 10 text

10 8.1 短期的な評価と⻑期的な評価 8.1.1 リピートユーザを考慮した最適化 8.2 解空間のデザイン 8.3 ウェブサイト以外への応⽤

Slide 11

Slide 11 text

11 今回の⼿法の特徴 • ⼈間との相互作⽤をもとにソフトウェアの最適な状態を探す • ブラックボックス関数の最適化 適⽤のための条件 • 提供するサービスを即座に変更できること • サービスに対するユーザの反応が常に計測できること IoTによってユーザの反応が即座に得られるようになると期待できる。反応に応じて提供するものを変更する ことで、提供物がサービス化していると考えられる。