5. 이웃 기반 협업 필터링 추천

5장에서는 전통적인 협업 필터링(Collaborative Filtering, CF) 알고리즘 중 하나인 k-최근접 이웃(k-Nearest Neighbor, k-NN)을 사용하는 메모리 기반 협업 필터링 추천 기법에 대하여 살펴봅니다. 이웃 기반 협업 필터링은 4장에서 살펴본 유사도를 기반으로 사용자 또는 아이템 기반으로 추천할 수 있습니다. 사용자 기반 협업 필터링은 추천 대상이 되는 사용자(이하 대상 사용자)와 유사한 사용자들(이웃)을 식별하고, 이들이 구매한 아이템들 중 대상 사용자가 아직 경험하지 못한 아이템의 평점을 예측하여 추천하거나 또는 이웃 기반의 아이템 기반 협업 필터링은 대상 사용자가 평가한 아이템들과 유사한 대상 사용자가 아직 경험하지 못한 아이템들(이웃)을 식별하고 아이템의 평점을 예측하여 추천하는 기법입니다. 이웃 기반 협업 필터링 추천 기법은 매번 모든 데이터를 계산하는 메모리 기반의 알고리즘으로 적용이 용이하고, 추천 결과에 대한 설명이 용이하다는 장점이 있지만, 추천 결과를 생성할 때마다 매번 많은 연산이 요구된다는 단점을 가지고 있습니다.

이번 장에서는 이웃 기반 협업 필터링 추천을 위한 예측 평점을 계산하는 방법에 대하여 살펴봅니다. 여기에서는 이웃 기반 협업 필터링 추천 기법에 관련된 모든 내용을 자세히 다루지는 않습니다. 대신 이웃 기반 협업 필터링으로 추천하기 위해 필요한 기본적인 개념과 방법들을 살펴봅니다. 또한, 예제 데이터를 사용하여 실제로 이웃 기반 협업 필터링 추천이 이루어지는 일련의 과정들을 단계별로 직접 계산해 보고 미리 구현된 Apache Spark와 R 예제 프로그램으로 데이터셋들을 직접 읽어 들여 계산해본 과정과 결과가 맞는지 한번 더 확인해 볼 것입니다.

이번 장을 학습하면 여러분은 다음 개념을 이해할 수 있어야 합니다.

  • 사용자 또는 아이템 기반 유사도에 기반한 k-최근접 이웃 선정
  • 유사도 가중 평균을 사용한 평점 예측과 상위 N개(Top-N) 아이템 추천

이번 장을 학습하면 여러분은 다음을 계산할 수 있어야 합니다.

  • 유사도에 기반한 k-최근접 이웃 선정
  • 유사도 가중 평균 기반 예측 평점 계산
  • 평점 평균과 유사도 평균 중심 가중 평균 기반 예측 평점 계산
  • 평점 평균과 유사도 Z점수 가중 평균 기반 예측 평점 계산

이번 장에서 다루는 내용은 다음과 같습니다.

한글:1107 영어:94 숫자:37

추천 시스템: 워크북

Comments

Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.

Instead of authenticating the giscus application, you can also comment directly on GitHub.