7.3 요약(Summary)

이번 장에서는 TF-IDF 콘텐츠 기반 필터링으로 추천하기 위해 필요한 개념들을 살펴보았습니다.

  • 문서 단어 행렬(DTM)

  • 단어 빈도(TF)

  • 역문서 빈도(IDF)

  • 벡터 길이 정규화

  • 평점 임곗값 기반의 사용자 프로필과 사용자가 평가하지 않은 아이템 프로필

  • 사용자 프로필과 아이템 프로필의 유사도

  • Top-N 아이템 추천

다음으로 콘텐츠 기반 필터링에서 TF-IDF 로 프로필 유사도를 계산하는 방법을 살펴보았습니다.

  • TF-IDF 계산

  • 벡터 길이 정규화 및 프로필 생성

  • 프로필 유사도 계산

표. 프로필 유사도 계산

구분 입력 출력
평점 임곗값 기반 원본 또는 정규화된 평점 및 태그 데이터(정수/실수형) Top-N 추천 아이템

이번 장에서는 TF-IDF 콘텐츠 기반 필터링에서 프로필 유사도를 계산하여 추천하는 방법에 대하여 살펴보았습니다. 다음 장에서는 연관 규칙 기반으로 추천하는 방법을 주제로 살펴볼 것입니다.

한글:295 영어:43 숫자:2

추천 시스템: 워크북

Comments

Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.

Instead of authenticating the giscus application, you can also comment directly on GitHub.