Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DMMTVにおけるデータ蓄積とモデル改善

nadare
June 04, 2024
200

 DMMTVにおけるデータ蓄積とモデル改善

「【DMM.com × Databricks】機械学習モデルの評価と改善」における発表資料です
https://dmm.connpass.com/event/313388/

nadare

June 04, 2024
Tweet

Transcript

  1. © DMM © DMM CONFIDENTIAL DMM TVにおける 定性評価とモデル改善 【DMM.com ×

    Databricks】機械学習モデルの評価と改善 合同会社DMM.com レコメンドGrowthチーム 金子剛士 2024/05/30
  2. © DMM 自己紹介 金子 剛士 (nadare) 2022年10月に合同会社DMM.comに入社 複数サービスでのレコメンドエンジン作成を担当 Kaggle Competitions Master

    最近の趣味はVRChatのBarでお酒を飲むこと 副業で開発しているAIボイチェン(Paravo)でバ美肉し ウィスキーを片手におしゃべりが楽しい 2 #dmm_databricks
  3. © DMM 1.たまたま出現したペアの強化による悪循環 新着棚に出ていた目につくマイナー作品が異常なFBを受けていた 1. データが少ない作品についての学習 メジャー作品 色々なユーザーの例から類似アイテムを学習 マイナー作品 たまたま一緒に視聴されたメジャー商品を類似商品と学習

    →大抵は一定以下の頻度しか出ていない作品は除去すると除ける 2. 間違ったレコメンドの学習の加速 目を引くマイナー作品が新着でトップにでる →ものめずらしさでクリックされ、類似アイテムとしての学習が強化 →さらにレコメンド上位に表示され、クリックが加速 5 #dmm_databricks
  4. © DMM 1.たまたま出現したペアの強化による悪循環 導入初期の念入りなチェック - 導入後数日~数週はユーザーをサンプルして履歴とレコメンド結果を比較 - 定期的に実施で違和感に気づいた レコメンドモデル自体の改善 -

    メタデータの追加、人気度を考慮したペナルティにより偶然を減らす - 学習のepoch数を減らし、間違ったペアの学習回数を減らす 表示コンテンツの改善 - データが少ない初期ほどノイズを拾いやすい - 新着・特集などの表示コンテンツに気を付け、良質なFBをモデルに与える 6 #dmm_databricks
  5. © DMM 2.過去データに引きずられる レコメンド導入後しばらくして、前やその前のクールの作品 ばかりでると報告 → 作品のリリース時期ごとのクリック数/視聴数のダッシュ ボード作成依頼 2024年1月中旬のレコメンドされた作品の割合が右 -

    レコメンド対象全体のランキングと比較し違和感 - 直近でログインしたユーザーに限定した定性評価・レ コメンド出現回数でチューニング 定性評価の対象を良く選ぶ 7 #dmm_databricks
  6. © DMM まとめ DMM TVのレコメンド改善における、データの観測とそれに基づく改善の事例について紹介しま した。 生成AIでは結果をインタラクティブに確認することが重要で BQ + notebookやスプレッドシートで可視化を行うほか

    gradioやTensorBoard、W&B等のツールの活用も有効です。 より細かいチューニングの内容や、他事業における改善の例もありますので 懇親会時に是非意見交換できればと思います。 11 #dmm_databricks