バンディットアルゴリズム

学会: AdKDD 2022 http://papers.adkdd.org/2022/papers/adkdd22-jeunen-learning.pdf 内容セカンドプライスオークションは強い仮定のもとでは真の価値を入札すれば最適戦略文脈が与えられた時の期待価値を入札者が知っている提示された入札額が商品の価値に影響しない競合の入札者は全員同じ情報にアクセスできるオークションの繰り

学会: AdKDD 2022 https://www.adkdd.org/Papers/Dynamic-collaborative-filtering-Thompson-Sampling-for-cross-domain-advertisements-recommendation/2022 内容色々なドメインの知識を転移させて、推薦システムを作りたい。トンプソンサンプリングでは自身のアームの結果を用いて Beta(Σclick, Σ(imp - click)) で事後分布を推定する。提案手法ではユーザのコサイン類似度 S(u, v) を用いて自身以外

バンディットアルゴリズム

Learning to Bid with AuctionGym

Dynamic collaborative filtering Thompson Sampling for cross-domain advertisements recommendation