6. 특잇값 분해 기반 협업 필터링 추천

6장에서는 행렬 분해(Matrix Factorization) 알고리즘 중 하나인 특잇값 분해(Singular Value Decomposition, 이하 SVD) 접근 방법을 사용하는 모델 기반 협업 필터링 추천 기법에 대하여 살펴봅니다. SVD 기반 협업 필터링 추천은 5장에서 살펴본 이웃 기반 협업 필터링 추천과 같이 매번 모든 데이터를 계산하는 메모리 기반의 추천과 달리 데이터를 기반하여 모델을 학습하고 이 모델을 통하여 아이템의 평점을 예측하여 추천하는 모델 기반 추천 기법입니다.

모델 기반 협업 필터링 추천 기법은 매번 모든 데이터를 계산하는 메모리 기반의 알고리즘과 달리 모델의 학습에는 많은 시간과 연산이 소요되지만 학습된 모델을 통해 추천 결과를 생성하는 시간과 연산은 많이 소요되지 않는다는 장점이 있지만, 추천 결과의 정확도가 메모리 기반의 알고리즘에 비해 다소 떨어지거나 모델이 자주 빠르게 갱신되어야 하는 추천 환경에는 적합하지 않다는 단점을 가지고 있습니다.

이번 장에서는 SVD 기반 협업 필터링 추천을 위한 예측 평점을 계산하는 방법에 대하여 살펴봅니다. 여기에서는 모델 기반 협업 필터링 추천 기법에 관련된 모든 내용을 자세히 다루지는 않습니다. 대신 SVD 기반 협업 필터링으로 추천하기 위해 필요한 기본적인 개념과 방법들을 살펴봅니다. 또한, 예제 데이터를 사용하여 실제로 이웃 기반 협업 필터링 추천이 이루어지는 일련의 과정들을 단계별로 직접 계산해 보고 미리 구현된 Apache Spark와 R 예제 프로그램으로 데이터셋들을 직접 읽어 들여 직접 계산해본 과정과 결과가 맞는지 한번 더 확인해 볼 것입니다.

이번 장을 학습하면 여러분은 다음 개념을 이해할 수 있어야 합니다.

  • 기준선 추정(Baseline Estimate)과 잔차(Residual)
  • 차원 축소와 특잇값 분해(SVD)

이번 장을 학습하면 여러분은 다음을 계산할 수 있어야 합니다.

  • 사용자 또는 아이템 기준의 평점 기준선 추정과 잔차 계산
  • 특잇값(Singular Value)과 특이 벡터 계산
  • 평점 기준선과 SVD 기반 예측 평점 계산

이번 장에서 다루는 내용은 아래와 같습니다.

  • 6.1 “모델기반 협업 필터링”에서는 모델 기반 협업 필터링에 대한 개념을 개략적으로 살펴봅니다.
  • 6.2 “특잇값 분해 평점 예측”에서는 평점 데이터의 기준선을 예측하는 방법과 잔차, 그리고 특잇값 분해로 예측 평점을 계산하고 상위 N개 아이템을 추천하는 방법에 대해 살펴봅니다.
한글:790 영어:123 숫자:15

추천 시스템: 워크북

Comments

Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.

Instead of authenticating the giscus application, you can also comment directly on GitHub.