Collaborative Filtering for Implicit Feedback Datasets

|

Implicit Feedback은 유저가 싫어하는 아이템에 대한 실질적인 증거가 부족함.(explicit에 비해)

따라서 본 논문에서는 implicit feedback의 고유한 속성을 식별한다.

데이터를 다양한 컨피던스와 관련된 긍정적이고, 부정적인 선호도의 지표로 취급하는 것을 제안한다.

우선 implicit feedback의 고유한 특성에 대해 알아보자.

  • No negative feedback
  • Noisy
  • numerical value of implicit feeback indicates confidence
  • Evaluation of implicit-feedback recommender requires appropriate measures

논문의 핵심은 기존의 explicit feedback과 달리 implicit이 고유하게 가지는 특성들이 존재하므로(특히 선호도를 정량화해서 나타내기 힘들다거나, negative feedback이 없다는점) 이를 고려해서 confidence로 접근하는 것이다.

rui

  • Explicit : 레이팅
  • Implicit : 선호도

이진 변수 pui 는 선호도를 나타내는 indicate function

pui={0,   rui>01,   rui=0

그런데 rui=0 일 지라도 그 아이템을 좋아하지 않는다고 말할 수 있을까? implicit은 앞서 말했던 것 처럼 noisy 하다.

따라서 이를 보완해줄 다른 방법을 제안한다.

cui=1+αrui

보는 것 처럼 rui 가 증가할 수록 유저가 아이템을 좋아한다는 ‘‘신뢰도’‘가 강해지는 것을 정량화 했다.

따라서 이를 포함하는 로스 함수는 다음과 같다.

minu,icui(puixuTyi)2+λ(u||xu||2+i||yi||2)

위 식에서 선호도 pui 는 기존의 user-item factor의 내적으로 사용한다.(위의 indicate랑 헷갈릴까봐 다시 적어준듯)

Referecne

Comments