自動入札をオンライン最適化アルゴリズムのFTRLで解くという論文
入札確率の累積分布は狭義単調増加+log-concave、期待支払額は広義単調増加、requestの総数はわかっているという仮定のもと
といった制約を統一的に解くことができるフレームワークを提案。
統一的に解けるので、制約の組み合わせも解ける。
制約をラグランジュの未定乗数法で表現した価値最大化目的関数をFTRLで解く。
LinkedInのオンライン予算分割A/Bテストにおいて、フィードバック制御に比べて8.25%ROIが改善。
Dynamic collaborative filtering Thompson Sampling for cross-domain advertisements recommendation
Multimodal Transformers for Detecting Bad Quality Ads on YouTube