BigQueryを使った機械学習プロジェクトの分析とオフライン検証

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Copyright © LIMIA, Inc. All Rights Reserved. ● グリーグループのリミア株式会社で、LIMIA という住まい領域のメディアを作っています。ゲーム会社ですが、最近はメディアに力を入れています。 ● 機械学習(RecSys)のエンジニアですが、iOS, Android,JSなどもやっている何でも屋です。5歳の娘のパパ。twitter: @mahiguch1 ● 部活動でグリー技術書典部を作り技術書典7参加、8に参加予定。 ● https://limia.jp/ ● https://arine.jp/ ● https://aumo.jp/ ● https://www.mine-3m.com/mine/ Masahiro Higuchi/樋口雅拓 2

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Copyright © LIMIA, Inc. All Rights Reserved. LIMIAでは、より良いユーザ体験を提供するため、ユーザ毎に最適な一覧表示を行なっています。【発表内容】それを実現するため、1.分析、2.オフライン検証、3.配信、4.オンライン検証、 5.レポートのシステムを構築しました。まず、0.推薦システムについて説明し、次に上記5システムについて説明します。最後に6.今後の課題について話します。【発表のモチベーション】知識を共有することで、機械学習基盤を効率的に構築したい！発展途上の分野で定石がないので、お気付きの点があれば教えて欲しい。概要 4

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Copyright © LIMIA, Inc. All Rights Reserved. 推薦システムを作るのは難しい。理想的には、以下の専門家が必要。 ● Analyst: データを分析して課題を発見 ● Data Scientist: Model作成 ● Algorithm Programer: 本番コード実装 ● ML Ops: インフラを作る ● Researcher: 使えそうな論文を見つけて共有 → この章では、それぞれの専門家がどんな環境で、何を目指して作業しているか説明します。プロジェクトの構成 6

Slide 7

Slide 7 text

Copyright © LIMIA, Inc. All Rights Reserved. 以下の目的のため、データを分析する。 ● ユーザ体験向上 ● 取引先企業の課題解決課題を解決するため、施策立案と施策評価を行う。昭和の言い方だと、上流工程? 機械学習が使えそうな課題があれば、DSに相談する。 → LIMIAではProductManager(PM)が担当。BigQueryとSpreadSheet を使って作業している。 Analyst 7

Slide 8

Slide 8 text

Copyright © LIMIA, Inc. All Rights Reserved. Analystから提案された課題の解決方法を提案する。 Researcherと相談して、使えそうな理論を選び、手元の開発環境でモデルを作る。作ったモデルをAlgorithm Programmerに渡してサービスに組み込んでもらう。Kagglerが多い。推薦システムは、次の4つの要素から構成される。※1 ● Item Modeling(Itemをvector化) ● User Modeling(Userをvector化) ● Scoring(それらを使ってscoreを作り) ● Ranking(1つ以上のscoreを使って並べ替え) それぞれで使える手法を選んで実装し、オフライン検証を行う。良い結果が出たら、Algorithm Programmerに渡す。 → LIMIAではAPが担当。Jupiter/Python/BigQueryを使う。 Data Scientist 8

Slide 9

Slide 9 text

Copyright © LIMIA, Inc. All Rights Reserved. Data Scientistが作ったモデルを使って、本番サービスで動くコードを書く。動作速度が問題となることが多いので、競技プログラミング (atcorder/topcorder)組が多い。実装して本番反映し、オンライン(A/B)検証を行い、結果が良ければ全ユーザへ適用する。 → LIMIAではAPとML Ops(発表者)が担当。golangで実装して本番デプロイして、オンライン検証結果を確認する。 Algorithm Programmer 9

Slide 10

Slide 10 text

Copyright © LIMIA, Inc. All Rights Reserved. Algorithm Programmerと相談して、最適なインフラを作る。学習と言われるバッチ処理は非常に重い。推論と言われるオンライン処理は、小さい latencyが求められる。また、自動最適化を行うため、ログの収集が非常に重要！ → LIMIAではML Ops(発表者)が担当。各種ログをBigQueryに収集している。vscodeでCloudFormationテンプレートを書いている。 ML Ops 10

Slide 11

Slide 11 text

Copyright © LIMIA, Inc. All Rights Reserved. 研究を行いKDD/RecSys/WWWなどでの発表を目指す。DS/AP/MOなどから相談を受け、使えそうな手法を提案する。また、因果推論によるオフライン評価、マルチタスクなど、最新の論文で使えそうな手法を提案してくれる。 → LIMIAでは明確な担当者不在。AP, MOとGREEのResearcherで論文輪読会を開いてカバーしている。 Researcher 11

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Copyright © LIMIA, Inc. All Rights Reserved. Firebase管理画面でボタンを押すだけでBigQueryにデータが連携される。連携されるデータは、次のもの。 ● Analytics: 送信した全てのイベント ● Crashlytics: 発生した例外の情報 ● Predictions: 予測結果 ● FCM: プッシュ通知送受信ログ ● Performance: 送信したトレース情報 Analytics以外のBigQueryデータは使いこなせていない。良い使い道があれば教えて欲しい。イベントログ Firebase 14

Slide 15

Slide 15 text

Copyright © LIMIA, Inc. All Rights Reserved. Embulkを使ってBigQueryへ転送している。Embulkコンテナを作り、ECS Fargateで回している。以下に要点だけ示す。 ● ALB: daily table(xxlog_20190828)に前日分を転送 ● CloudFront: ファイル名で前日分を特定できないので、手元に最終更新日時指定でs3 syncしてから転送。 ● RDS: 負荷を考慮して1テーブルずつ転送。daily tableを切らずに上書きしていく。履歴は残らないが、MySQLと同じqueryが使える。 ● Dynamo: 構造化データはjson文字列として格納。 GCP service accountは、EKSで暗号化したファイルをcontainerに含めている。embulkはfargateのExecRoleを見てくれないので、AWS IAM user を環境変数で渡している。 AWSのデータ ALBとCloudFrontのアクセスログ/RDSとDynamoのデータ 15

Slide 16

Slide 16 text

Copyright © LIMIA, Inc. All Rights Reserved. ● Search Console: golangバッチでAPIから取得し、BigQueryへ転送。 ECS fargate taskで毎晩実行。 ● Google Analytics: 集計パターンをいくつか作り、それぞれをBigQuery の対象テーブルへ転送。実行環境はSCと同じ。 ● Adjust: Cloud FunctionsにEndpointを作り、来たデータを全て BigQueryに格納。AdjustのGlobal Callbackに設定。 ● Kintone: 一部業務の管理ツールとしてKintoneが使われていたため、 Kintone APIをGASで叩いてBigQueryへ。その他のログ SearchConsole/GoogleAnalytics/Adjust 16

Slide 17

Slide 17 text

Copyright © LIMIA, Inc. All Rights Reserved. 原則データの確認はRDS/Dynamo等は使わず、BigQueryにある早朝に取ったスナップショットに対して行う。BigQuery画面からが多く、DSは Jupiter+pandasから。 ● Analyst: 施策立案のための状況把握。施策の想定効果見積もりと効果測定。KPI変化の要因分析。 ● Data Scientist: パーソナライズを行うため、ユーザやアイテムの特徴を分析。オフライン検証。 ● Algorithm Programmer: オンライン検証結果確認。 ● ML Ops: エラーログ、動作速度、機能の利用状況などでシステムの健全性を分析。誰が何を分析しているのか仮説を立てて定量的に検証する 17

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Copyright © LIMIA, Inc. All Rights Reserved. Data Scientistが過去のデータを使って、モデルの良し悪しを検証する。良いモデルができたら、APにJupiter Notebookを渡す。 → LIMIAではgistにnotebookを貼り付けて連携。左図はGoogle Colaboratoryというインストールなしで使えるJupiter Notebookのようなもの。 https://colab.research.google.com/?hl=ja オフライン検証とは？ Data Scientistの領域 20

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Copyright © LIMIA, Inc. All Rights Reserved. オフライン検証のベースラインとして、人気のあるコンテンツを全員に配信したときを想定する。 Cell/Itemを表示したらFirebase Analyticsにimpression eventを送信し、Clickしたらclick eventを送信してBigQueryに格納する。イベント数で割り算したCTRを人気記事の定義とした。 → LIMIAではCTRがこれを上回ったら、オンライン検証に移行。合格ラインは？ Popular Model 22

Slide 23

Slide 23 text

Copyright © LIMIA, Inc. All Rights Reserved. ● Item Modeling: 記事を形態素解析して名詞を取り出し、それをword embeddingしたvectorの平均を取った。 ● User Modeling: ユーザが読んだ直近30件のItemのvectorの平均を取った。 ● Scoring: ItemとUserの距離。 ● Ranking: Scoreの大きい順に並べた。全Itemとの距離を計算すると重いので、10個に分類して中心点との距離を距離を計算することにした。クラスタ内での並び順は、CTR順。チャレンジし過ぎてRecSys2019のベストペーパーに指摘されるような事態は避けたい。オフライン検証を通過したモデル教科書に書いてある事を愚直に 23

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Copyright © LIMIA, Inc. All Rights Reserved. DSから受け取ったNotebookは、以下のようになっていました。 ● 学習: バッチでItemとUserをベクトル化しておきます。 ● 推論: ユーザが一覧表示をリクエストすると、それらを使って一覧表示を作ります。これを受けて、次のようなシステムを構築しました。 ● 学習: Item/Userの更新通知を既にKinesisに流していたため、これを受け取って処理するLambdaを追加しました。 ● 推論: APIをgolangで作っているため、そこに処理を追加しました。システム概要ここはAWSです！すいません。m(_ _)m 26

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Copyright © LIMIA, Inc. All Rights Reserved. ● RemoteConfigはKey-Valueストア。 ● PCブラウザから設定できるので、企画側で対応可能。 ● Firebase A/B Testingでは、直接的には指定したRemoteConfig key の値が変更される。 ● そこでデータを取得するAPI毎に RemoteConfig keyを作成する。 Firebase A/B Testingを使った手法(1) Firebase RemoteConfig設定 32

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Copyright © LIMIA, Inc. All Rights Reserved. 【Firebase A/B Testing手法】 A/Bテストでどちらのセグメントに振り分けられたか、UserPropertyに設定されます。keyは次のようになります。 ﬁrebase_exp_ 【独自実装】 FAにsetUserId()という足が生えているので、それで設定するとUserPropertyの user_idに設定されている。パターン毎の集計方法 Firebase A/B Testingと独自実装 39

Slide 40

Slide 40 text

Slide 41

Slide 41 text

Copyright © LIMIA, Inc. All Rights Reserved. ● LTVと相関が強い指標を探す。特にRetentionを上げる方法。 ● ピックアップ以外でパーソナライズしたい場所があれば。他タブ、回遊導線、プッシュ通知、検索結果など。 ● BigQueryのqueryを実装するより早く分析する方法。GAのWeb+App の分析機能??? 今後の課題 Analyst領域 41

Slide 42

Slide 42 text

Copyright © LIMIA, Inc. All Rights Reserved. ● ItemModel: word embedding(学習データにLIMIAの記事を加える。最新のWE手法を使う。 ● ItemModel: 形態素解析の辞書をチューニング。user辞書にLIMIA記事。neologd利用。 ● UserModel: 平均 vs RNN(読んだ順序を考慮するか) ● Scoring: 協調フィルタリングのScoreを作って既存に加える ● Ranking: アドテクを参考にFrequency Capをかけて、興味のない記事を掲載されずらくする ● Kaggleを頑張る今後の課題 Data Scientist領域 42

Slide 43

Slide 43 text

Slide 44

Slide 44 text

Slide 45

Slide 45 text

Slide 46

Slide 46 text

Slide 47

Slide 47 text

Copyright © LIMIA, Inc. All Rights Reserved. ● ユーザ体験向上のため、一覧表示のパーソナライズを行った。 ● この構成が良いと思っていないので、お気付きの点があれば指摘して欲しい。歴史が浅い分野なので、情報を共有して僕らで定石を作っていきたい。 ● 機械学習prjは、様々な専門性を持つ人達を結集する必要がある。しかし仲間が少なく、一人で複数の専門性を見ているので成長が遅い。まとめ 47

Slide 48

Slide 48 text

Slide 49

Slide 49 text

Slide 50

Slide 50 text

Copyright © LIMIA, Inc. All Rights Reserved. ● 1: 書籍:推薦システム https://www.kyoritsu-pub.co.jp/bookdetail/9784320124301 ● 2: Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches https://arxiv.org/pdf/1907.06902.pdf ● 参考資料資料中の※は、以下の資料を表す。 50

Slide 51

Slide 51 text

Copyright © LIMIA, Inc. All Rights Reserved. 類似ユーザに人気の記事を配信することで、CTRが上がるという仮説を検証した。ユーザをいくつかのクラスタに分類する。分類結果をBigQueryに送信し、クラスタ毎のCTRを集計する。定期的に集計してストレージに格納しておき、ユーザは所属するクラスタ内で CTRが高い記事を一覧表示する。これをPopular Modelとオフラインで比較して、既存手法とオンラインで比較した。失敗した手法 Segmentation Popular Model　 51

Slide 52

Slide 52 text

Copyright © LIMIA, Inc. All Rights Reserved. LIMIAにはtwitterのようにユーザをフォローする機能がある。フォロー数が多いほど来訪頻度が高いことが分かっている。興味のあるユーザを推薦することでフォロー数が増えるという仮説を検証した。 BigQueryにあるフォロー情報を使ってUser x Userの行列を作る。コサイン距離を計算するUDFを作り、類似ユーザを抽出した。自分がフォローしている人の類似ユーザや類似ユーザがフォローしていて自分がしていない人を推薦した。その他の推薦 UDFを使った協調フィルタリング 52