Relevance Constrained Re-ranking in Sponsored Listing Recommendations
Page content
メモ
- 問題設定: ECサイトでスポンサーリスティングありの検索結果表示で、score = p (CV確率) * c (販売コスト) + w (重み) * p (CV確率) * b (広告レート) 順に商品を並び替える
- 課題: 広告の売り上げと商品の販売高にはトレードオフがあり、重みwによって調整できるので、良い感じの重みを動的にチューニングする。
- 関連度順に引いた商品に対するKL-Divergenceを制約として売り上げを最大化する最適化問題として解く。
- KL-Divergenceのを選んだのは、確率は正規化されているので購入確率のスケーリングに影響されないため
- 手法1: KD-Divergenceの制約を満たす限りにおいて、広告収益が最大になるように貪欲なGridSearchでとく
- 手法2: KD-Divergenceを予測する。特徴量は引いた商品の数や総額、PTRスコア、広告料金の要約統計量、重みw(one hot)を用いる。OLSの推論時は w=θKL−β0−∑n,i≠wi=0xi⋅βiβw として重みを決める。GBDTも検討。
- 実験1:固定の重みとKL-Divergenceの予測の比較。予測は優位性は示されなかったが、広告売り上げと商品売り上げのトレードオフを解消できた。
- 実験2:A/Bテストによる比較。予測ベースの手法として、OLSとGBDTを比較するとGBDTが優れていた。GBDTは購入数を変えずに広告売り上げを増やし、貪欲砲は購入数と広告売り上げを増加させた。実装の簡単さからGBDTを本番で採用した。