4.6 요약(Summary)
이번 장에서는 평점 데이터의 유사성을 측정하기 위해 필요한 개념들을 살펴보았습니다.
- 유사도와 비유사도
- 거리와 유사도의 관계
- 유사도와 거리 측도
- 상관관계
- 이진 속성과 유사도
다음으로 평점 데이터를 사용하여 사용자나 아이템 간 유사도를 계산하는 대표적인 방법들을 살펴보았습니다. 또한, 이진화된 평점 데이터의 유사성을 측정하는 방법에 대하여도 살펴보았습니다.
- 코사인 유사도(Cosine Similarity)
- 피어슨 상관계수(Pearson Correlation Coefficient)
- 유클리드 거리(Euclidean Distance)
- 확장 자카드 계수(Extended Jaccard Coefficient)
표. 유사도 측도
구분 | 입력 | 적용 기준 | 출력 |
---|---|---|---|
코사인 유사도 | 원본 또는 정규화된 평점 데이터(정수/실수형) | 사용자/아이템 | 유사도 데이터(실수형) |
피어슨 유사도 | |||
유클리드 유사도 | |||
확장 자카드 유사도 | 이진화된 평점 데이터(이진형) |
이번 장에서는 대표적인 유사도 측도에 대하여 살펴보았습니다. 다음 장에서는 평점 데이터를 사용하여 이웃 기반 협업 필터링으로 추천하는 방법을 주제로 살펴볼 것입니다.
한글:338 영어:327 숫자:13
추천 시스템: 워크북
Comments
Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.
Instead of authenticating the giscus application, you can also comment directly on GitHub.