2.4 요약(Summary)
이번 장에서는 예제 프로그램에서 사용하는 데이터셋들을 살펴보았습니다.
2.1 "북크로싱 데이터셋"에서는 북크로싱 데이터셋에 대한 전반적인 내용을 살펴보았습니다. 이 장에서 살펴본 북크로싱 데이터셋의 주요 속성들을 다음의 표에서 다시 한번 확인해 봅니다.
북크로싱 데이터셋의 주요 속성
데이터 | 건수 | 명칭 | 속성 |
---|---|---|---|
도서 | 271,379 | 국제표준도서번호 | ISBN |
도서명 | Book-Title | ||
도서-평점 | 1,149,780 | 사용자ID | User-ID |
국제표준도서번호 | ISBN | ||
평점 | Book-Rating |
2.2 "무비렌즈 데이터셋"에서는 무비렌즈 데이터셋에 대한 전반적인 내용을 살펴보았습니다. 이 장에서 살펴본 무비렌즈 데이터셋의 주요 속성들을 다음의 표에서 다시 한번 확인해 봅니다.
무비렌즈 데이터셋의 주요 속성
데이터 | 건수 | 명칭 | 속성 |
---|---|---|---|
영화 | 58,098 | 영화ID | movieId |
제목 | title | ||
평점 | 27,753,444 | 사용자ID | userId |
영화ID | movieId | ||
평점 | rating | ||
태그 | 1,108,997 | 사용자ID | movieId |
태그 | tag | ||
타임스탬프 | timestamp |
2.3 "예제 데이터셋"에서는 예제 데이터셋에 대한 전반적인 내용을 살펴보았습니다. 이 장에서 살펴본 예제 데이터셋의 주요 속성들을 다음의 표에서 다시 한번 확인해 봅니다.
예제 데이터셋의 주요 속성
데이터 | 건수 | 명칭 | 속성 |
---|---|---|---|
아이템 | 10 | 아이템 | item |
라벨 | label | ||
평점 | 30 | 사용자 | user |
아이템 | item | ||
평점 | rating | ||
타임스탬프 | timestamp | ||
태그 | 30 | 사용자 | user |
아이템 | item | ||
태그 | tag | ||
타임스탬프 | timestamp | ||
단어 | 30 | 사용자 | user |
아이템 | item | ||
단어 | term | ||
타임스탬프 | timestamp |
다음 장에서는 사용자의 서로 다른 평점 성향을 조정하는 방법인 평점 정규화에 관해서 살펴볼 것입니다.
추천 시스템: 워크북
Comments
Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.
Instead of authenticating the giscus application, you can also comment directly on GitHub.