4.6 요약(Summary)

이번 장에서는 평점 데이터의 유사성을 측정하기 위해 필요한 개념들을 살펴보았습니다.

  • 유사도와 비유사도
  • 거리와 유사도의 관계
  • 유사도와 거리 측도
  • 상관관계
  • 이진 속성과 유사도

다음으로 평점 데이터를 사용하여 사용자나 아이템 간 유사도를 계산하는 대표적인 방법들을 살펴보았습니다. 또한, 이진화된 평점 데이터의 유사성을 측정하는 방법에 대하여도 살펴보았습니다.

  • 코사인 유사도(Cosine Similarity)
  • 피어슨 상관계수(Pearson Correlation Coefficient)
  • 유클리드 거리(Euclidean Distance)
  • 확장 자카드 계수(Extended Jaccard Coefficient)

표. 유사도 측도

구분 입력 적용 기준 출력
코사인 유사도 원본 또는 정규화된 평점 데이터(정수/실수형) 사용자/아이템 유사도 데이터(실수형)
피어슨 유사도
유클리드 유사도
확장 자카드 유사도 이진화된 평점 데이터(이진형)

이번 장에서는 대표적인 유사도 측도에 대하여 살펴보았습니다. 다음 장에서는 평점 데이터를 사용하여 이웃 기반 협업 필터링으로 추천하는 방법을 주제로 살펴볼 것입니다.

한글:338 영어:327 숫자:13

추천 시스템: 워크북

Comments

Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.

Instead of authenticating the giscus application, you can also comment directly on GitHub.