2024 Nikkei Inc. All rights reserved. 新規有料会員登録ユーザー:「自分に合った記事が見つけづらい」 10 新規ユーザーのオンボーディングにおける課題 トップや朝刊の記事は難しい 時間をかけずに読みたい 記事を探したい もっと個々人に合わせて情報を 取捨選択してほしい
2024 Nikkei Inc. All rights reserved. 12 For Youでは二種類のレコメンドを提供 • アンケートの回答に基づくレコメンド • 登録直後でも関心に合う記事を推薦できる • 閲覧記事に基づくレコメンド • より直近の関心に応じた記事を推薦できる 本日はこちら↗のレコメンドシステムの新規開発事例を共有します
2024 Nikkei Inc. All rights reserved. • 行動ログの少ない新規ユーザーにも効果的なレコメンドをしたい • 新着記事を随時システムに取り込みレコメンド候補に含めたい • ある程度過去の記事もレコメンドするため、対象記事数に対してスケールする 手法を選びたい 20 ここまでのまとめ
2024 Nikkei Inc. All rights reserved. • Task:Next-item prediction • User Towerの特徴量: ユーザーの直近閲覧記事の系列 ◦ ユーザーIDに対する埋め込みを学習せずに済むので新規ユーザーに推薦しやすい ◦ 数記事読むだけで次に読みそうな記事が推薦できる • Article Towerの特徴量: 記事のタイトル・本文のNLPモデルによる埋め込み ◦ 記事IDに対する埋め込みを学習せずに済むので新着記事を推薦対象にしやすい ◦ 最近は品質が高い埋め込みが利用できるので特徴量として強い 22 クリック系列を学習するTwo Towerモデルを作成 User Tower Article Tower User features Article features
2024 Nikkei Inc. All rights reserved. • 記事の公開日時 • ユーザーの記事閲覧日時 ◦ YouTubeやNetflixで有効性が報告され ている ◦ 過去のある時点だけ人気だった記事が 過剰に推薦されるのを防ぐ 23 Time featuresが重要 推薦記事の公開日分布
2024 Nikkei Inc. All rights reserved. 25 ニアリアルタイムで推論するための構成 Sagemaker: Two Towerモデルによる ユーザーベクトルの推論 AWS Batch: 記事ベクトルの定期推論 Kinesis Data Streams: リアルタイム行動ログ • ユーザー行動ログ • 記事ベクトル レコメンドAPI
2024 Nikkei Inc. All rights reserved. 29 ニアリアルタイムで推論するための構成 Sagemaker: Two Towerモデルによる ユーザーベクトルの推論 AWS Batch: 記事ベクトルの定期推論 Kinesis Data Streams: リアルタイム行動ログ • ユーザー行動ログ • 記事ベクトル レコメンドAPI ESによる近似近傍探索で推薦記事取得
2024 Nikkei Inc. All rights reserved. 既存のアプリトップのおすすめ:複数ロジックの組み合わせ • 閲覧カテゴリなどに基づくルールベース • 協調フィルタリング(jubatus) 2週間のABテストを実施 32 電子版アプリトップでABテストを実施 Two TowerモデルのCTR 既存のおすすめロジックCTR : +5%!
2024 Nikkei Inc. All rights reserved. 1. 日経/ニュース記事におけるレコメンドではコールドスタート問題やリアルタ イム性に向き合うことが重要 2. データサイエンス的なアプローチとバックエンド・インフラ的なアプローチの 両方が必要 3. For YouやトップタブのCTRを改善することができた 35 まとめ
2024 Nikkei Inc. All rights reserved. • AIチームではML/AI技術を使ってサービス改善に取り組んでいます • バックエンド開発からモデルの構築・リリース後の効果検証まで幅広く担える環境です • 日経でのML/AI活用に興味がある方、ぜひカジュアル面談しましょう! https://hack.nikkei.com/ 36 最後に