less than 1 minute read

Day 86

SOTA of RecSys 살펴보기

State-of-the-art (SOTA) RecSys 연구의 근간이 되는 중요한 논문들에 대해 살펴보자.

With an instance Reweighting Matrix Factorization

Matrix Factorization

사용자와 아이템의 저차원 표현 (low-dimensional representations)을 학습하는 방법이다.

image

명시적인 feature 를 사용하지 않고도 잠재 표현을 학습하기 때문에 Latent Factor Model이라고도 한다.

image

MF는 Explicit feedback 으로 이루어진 rating을 예측하는 데에도 쓰이지만, Implicit feedback으로 이루어진 데이터로부터 ranking을 수행하는 데에도 효과적으로 쓰인다.

  • Rating Prediction with Explict feeback
    • Regression Optimize error metrics ( ex] RMSE )
  • Top-K Raknking with Implicit feedback
    • Classfication approaches

Instance re-weighting scheme

MF로 Implicit feedback을 다룰 때에는 행렬의 각 원소에 서로 다른 confidence 값을 부여하는 Instance re-weighting scheme 이 활용됨

image

image

Bayesian Personalized Ranking

사용자의 선호도를 두 아이템 간의 Pairwise-ranking 문제로 접근한다. 각 사용자 u의 Personalized Ranking Function (i >u j)을 추정한다.

  • 기존의 방법들은 missing value를 0 으로 처리했고 그결과 선호하지 않는 아이템과, 사용자가 경험하지 않았지만 선호할지 모르는 아이템이 섞이게 되었다.
    • BPR을 통해 이를 보완했다.
  • Positive Instance (+)에는 높은 score를 주고 non-positive instance (?) 에는 낮은 score를 주어 ranking하는 형태로 변경했다.

BPR-OPT

Maximum a Posteriori, Maximum Likelihood Estimate를 통해 OPT 유도

image

MF는 pointwise (one item)의 optimzation을 BPR은 pairwise( two items)의 비교로 optimzation 갖는다.

image

AUC

image

BPR-OPT를 최적하 하는것이 AUC를 최적화 하는것과 유사함을 알 수 있다.

image

Leave a comment