© LY Corporation
関連研究
マルチモーダルな入力の取り扱い
● 言語・非言語の情報を1つの言語モデルで扱う
○ VideoBERT, CTR-BERT [Muhamed+ NeurIPS-W’21]
, NumBERT [Zhang+ EMNLP-F’20]
,
👎 非言語用のトークンの追加に伴って言語モデルの構成が複雑に
👎 学習と推論それぞれでモデルの更新やCTR予測で重要なリアルタイム動作が困難
これまでのCTR予測モデル
● ユーザに見せる広告や検索結果の選択
○ 検索連動型広告 [Jansen+ IJEB’08]
, パーソナライズ推薦システム [Sharma+ IJETT’13]
● 低レイテンシで正確な予測が必要 (以下のモデルは今は使われていないかも?)
○ Phoenix
[email protected] [Fan+ KDD’19]
, FTRL@Google Ads [MacMahan+ KDD’13]
,
Wide & Deep@Google Play [Cheng+ DLRS’16]
, NN+GBDT@MS Bing [Ling+ WWW-C’17]
7
あとで提案手法は NumBERT を
ベースにしていると説明されているので、
このような書き方だと提案手法を
否定することになりそう🤔