Calibrated Recommendations (Recsys 2018) を読んだ

3行で

レコメンドエンジンの性能がよくなればなるほど、かつアイテムに偏りがある場合(ECサイトにおけるアイテムジャンルの偏りなど)、次第にレコメンド結果が似通ったアイテムに偏りがちになるという問題が存在します。

本論文ではその補正(calibrate)の方法について提案しました。おなじみMovieLens20Mを用いた実験で提案手法が想定通り機能することを示しています。

背景

ある動画サイトではAとB２つのジャンルがあるとします。ジャンルAには動画の70%, Bには動画の30%があるとする。このサイトには随時N件のレコメンド枠があるとします。

とあるユーザーUはジャンルA,B同等に興味を持つとします。

このとき、

Uに対してA:B 7:3の割合で提示する Uはこの中からランダムに選ぶ (ポジションバイアスなどは忘れる) が、Aを7割の確率で選ぶことにレコメンドエンジンはUがAを選びやすいことから、Aをより多く出すようにする。。。

の繰り返しの結果、いつしかユーザーUに対してはジャンルAの動画ばかり並ぶことになる、というのがこの論文で主題にしている問題となります。(エコーチェンバー現象と名付けられています)

本論文はこの課題をスコア補正によって解決しようと試みています。ようするに、レコメンドされるアイテムのジャンル比率を、過去にそのユーザーが見たアイテムのジャンル比率と一致させるように補正すればいいよねっていう発想です。

手法

metrics

まず、「適切に補正されているか」を示すメトリクスが必要になります。少なくとも筆者によれば「この課題に特化したmetricsはない」と言っています (DiversityやFairnessのmetricsもtackleしている問題設定としては似ていますが、非なる問題であると言及)

ユーザーuが過去に再生した動画のジャンル分布を

$p(g|u) = \frac{\Sigma _ {i \in H} w _ {u,i} \cdot p(g|i)}{\Sigma _ {i \in H} w _ {u,i}}$

ユーザーuがレコメンドされた動画セット $I$ のジャンル分布を

$q(g|u) = \frac{\Sigma _ {i \in I} w _ {r(i)} \cdot p(g|i)}{\Sigma _ {i \in I} w _ {r(i)}}$

で表現したとき、KLダイバージェンス

$C _ {KL} (p ,q) = \Sigma _ {g} p(g|u) log \frac{p(g|u} {\tilde{q}(g|u)}$

を「小さいほど、ユーザーの興味に対して推薦アイテムのジャンルが偏っていない」　指標として用いるわけです。

そして、推薦アイテム集合 $I$ があるとき、 $s(I)$ をアイテムセットIに含まれるスコア(クリック予測値とかそういったもの) の和として、

f:id:Graphium:20190227174203p:plain

( $I$ はユーザーにレコメンドするアイテムの集合、Nはレコメンドするアイテムの数、 $\lambda$ はレコメンドスコアとcalibrated scoreのどちらをより重視するかのパラメータとなります.

この最適化問題を解くことでジャンル偏りを補正することを提案していますただし当然ながら多項式で解ける問題ではないです。故に空のリストを用意し、推薦スコアの高いアイテムから順にCalibrated Scoreが最大化するようなアイテムを探してリストに追加していく、というアルゴリズムを用いることを提案しています