7.3 요약(Summary)
이번 장에서는 TF-IDF 콘텐츠 기반 필터링으로 추천하기 위해 필요한 개념들을 살펴보았습니다.
-
문서 단어 행렬(DTM)
-
단어 빈도(TF)
-
역문서 빈도(IDF)
-
벡터 길이 정규화
-
평점 임곗값 기반의 사용자 프로필과 사용자가 평가하지 않은 아이템 프로필
-
사용자 프로필과 아이템 프로필의 유사도
-
Top-N 아이템 추천
다음으로 콘텐츠 기반 필터링에서 TF-IDF 로 프로필 유사도를 계산하는 방법을 살펴보았습니다.
-
TF-IDF 계산
-
벡터 길이 정규화 및 프로필 생성
-
프로필 유사도 계산
표. 프로필 유사도 계산
구분 | 입력 | 출력 |
---|---|---|
평점 임곗값 기반 | 원본 또는 정규화된 평점 및 태그 데이터(정수/실수형) | Top-N 추천 아이템 |
이번 장에서는 TF-IDF 콘텐츠 기반 필터링에서 프로필 유사도를 계산하여 추천하는 방법에 대하여 살펴보았습니다. 다음 장에서는 연관 규칙 기반으로 추천하는 방법을 주제로 살펴볼 것입니다.
추천 시스템: 워크북
Comments
Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.
Instead of authenticating the giscus application, you can also comment directly on GitHub.