Dynamic collaborative filtering Thompson Sampling for cross-domain advertisements recommendation

Page content

内容

  • 色々なドメインの知識を転移させて、推薦システムを作りたい。
  • トンプソンサンプリングでは自身のアームの結果を用いて Beta(Σclick, Σ(imp - click)) で事後分布を推定する。
  • 提案手法ではユーザのコサイン類似度 S(u, v) を用いて自身以外の報酬を重み付ける。つまり、Beta(Σ S(u, v)*click, Σ S(u, v)*(imp - click)) で事後分布を推定する。