less than 1 minute read

Day 36

Unsupervised Learning Mode

  • Latent Factor Model
    • 유저와 아이템 사이 다양한 정보를 담은 데이터를 축약된 벡터 공간에 표현할 수 있다는 아이디어
    • 축약된 벡터가 가까운 유저 혹은 아이템은 유사하다고 볼 수 있음
    • 저차원으로 매핑 했을 때 시각적으로 유저와 아이템의 유사성을 시각적으로 판단할 수 있으나, 각 잠재변수의 의믜를 정확히 알수 없음
    • Latent Factor 행렬들을 만들어 이들의 행렬곱으로 User-Item 행렬에서 비어있는 값을 유추한다.
  • Singular Value Decomposition
    • SVD 이용하여 행렬을 분해하고 차원 축소한다. \(R=U\Sigma V^{T} (Full SVD)\) \(R\approx \widehat{U}^{r}\sum _{k}\widehat{V}^{T} (Trucated SVD)\)
  • Matrix Factorization
  • Alternative Least Square
  • Hybrid approach

Supervised Learning Model

  • Naive Bayes
  • GBDT(Gradient Boosting Decision Trees)
  • Deep Learning

부캠 Book Rating Prediction 대회

  • user
    • 나라에 따른 언어
    • 지역에 따른 유행
    • 연령대 «
  • book
    • 카테고리/장르 살펴보기 → 나중에 문제되면 수정.
    • 같은 publisher에서 책을 구매한적 있던 사람
    • summary word2vec 유사도
    • 책 제목 길이랑 레이팅 선호도의 관계를 한번보자 (개인적으로 짧은 제목이 더 강렬했던 듯)
    • isbn 찾아보기
    • 각 책의 평균 rating
  • train_rating
    • 평점의 분포 살펴보기
    • 연령대에 따른 장를 선호도
    • 시간이 지날수록 평점이 높아짐 → 재평가

Leave a comment