8. 연관 규칙 기반 필터링 추천
8장에서는 연관 규칙(Association Rules)을 사용하는 추천 기법에 대하여 살펴봅니다. 연관 규칙 추천은 어떤 아이템과 동반하여 등장하는 아이템에 대한 규칙인 아이템 간의 연관성을 분석하여 같이 나타나는 경향이 있는 특정 아이템과 다른 아이템 상호 간에 어떤 연관 관계가 있는지를 찾아보고 이를 기반으로 추천합니다. 연관 규칙은 대규모의 데이터 항목 중에 유용한 연관성과 상관관계를 찾는 방법입니다. 기본 개념은 쇼핑몰의 장바구니나 결제 내역에서 담긴 아이템 사이의 관계를 찾아 서로 다른 아이템의 구매 사이에서 동시에 구매될 가능성이 큰 상품을 찾아내는 것입니다. 이러한 분석을 장바구니 분석(Market Basket Analysis) 또는 친화도 분석(Affinity Analysis)이라고도 합니다.
이번 장에서는 연관 규칙 기반 추천을 위해 평점 데이터에서 사용자가 특정 아이템을 평가하는 행위가 트랜잭션(transaction), 이 개별 트랜잭션에 포함된 아이템들인 항목 집합으로 연관된 규칙을 찾는 방법에 대하여 살펴봅니다. 여기에서는 연관 규칙에 관련된 모든 내용을 자세히 다루지는 않습니다. 대신 연관 규칙으로 추천하는 데 필요한 핵심 기본 개념을 살펴봅니다.
또한, 예제 데이터를 사용하여 실제로 연관 규칙 기반 필터링 추천이 이루어지는 일련의 과정을 단계별로 직접 계산해 봅니다. 그런 후 미리 구현된 Apache Spark와 R 예제 프로그램으로 데이터셋들을 직접 읽어 들여 직접 계산해본 과정과 결과가 맞는지 한 번 더 확인해 볼 것입니다.
이번 장을 학습하면 여러분은 다음 개념을 이해할 수 있어야 합니다.
-
트랜잭션(Transaction)과 항목 집합(Itemset)
-
연관 규칙의 지지도(Support)와 신뢰도(Confidence)
- 흥미도 측도(Interestingness Measure)
이번 장을 학습하면 여러분은 다음을 계산할 수 있어야 합니다.
-
항목 집합(Itemset)의 지지도(Support)
-
항목 집합(Itemset)의 신뢰도(Confidence)
-
항목 집합(Itemset)의 향상도(Lift)
이번 장에서 다루는 내용은 아래와 같습니다.
- 8.1 “연관 규칙”에서는 연관 규칙에 대한 개념을 개략적으로 살펴봅니다.
- 8.2 “연관 규칙 기반 아이템 추천”에서는 평점 데이터의 트랜잭션과 항목 집합으로 연관된 규칙을 찾고 상위 N개 아이템을 추천하는 방법에 대해 살펴봅니다.
추천 시스템: 워크북
Comments
Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.
Instead of authenticating the giscus application, you can also comment directly on GitHub.