2.4 요약(Summary)
이번 장에서는 예제 프로그램에서 사용하는 데이터셋들을 살펴보았습니다.
2.1 "북크로싱 데이터셋"에서는 북크로싱 데이터셋에 대한 전반적인 내용을 살펴보았습니다. 이 장에서 살펴본 북크로싱 데이터셋의 주요 속성들을 다음의 표에서 다시 한번 확인해 봅니다.
북크로싱 데이터셋의 주요 속성
| 데이터 | 건수 | 명칭 | 속성 |
|---|---|---|---|
| 도서 | 271,379 | 국제표준도서번호 | ISBN |
| 도서명 | Book-Title | ||
| 도서-평점 | 1,149,780 | 사용자ID | User-ID |
| 국제표준도서번호 | ISBN | ||
| 평점 | Book-Rating |
2.2 "무비렌즈 데이터셋"에서는 무비렌즈 데이터셋에 대한 전반적인 내용을 살펴보았습니다. 이 장에서 살펴본 무비렌즈 데이터셋의 주요 속성들을 다음의 표에서 다시 한번 확인해 봅니다.
무비렌즈 데이터셋의 주요 속성
| 데이터 | 건수 | 명칭 | 속성 |
|---|---|---|---|
| 영화 | 58,098 | 영화ID | movieId |
| 제목 | title | ||
| 평점 | 27,753,444 | 사용자ID | userId |
| 영화ID | movieId | ||
| 평점 | rating | ||
| 태그 | 1,108,997 | 사용자ID | movieId |
| 태그 | tag | ||
| 타임스탬프 | timestamp |
2.3 "예제 데이터셋"에서는 예제 데이터셋에 대한 전반적인 내용을 살펴보았습니다. 이 장에서 살펴본 예제 데이터셋의 주요 속성들을 다음의 표에서 다시 한번 확인해 봅니다.
예제 데이터셋의 주요 속성
| 데이터 | 건수 | 명칭 | 속성 |
|---|---|---|---|
| 아이템 | 10 | 아이템 | item |
| 라벨 | label | ||
| 평점 | 30 | 사용자 | user |
| 아이템 | item | ||
| 평점 | rating | ||
| 타임스탬프 | timestamp | ||
| 태그 | 30 | 사용자 | user |
| 아이템 | item | ||
| 태그 | tag | ||
| 타임스탬프 | timestamp | ||
| 단어 | 30 | 사용자 | user |
| 아이템 | item | ||
| 단어 | term | ||
| 타임스탬프 | timestamp |
다음 장에서는 사용자의 서로 다른 평점 성향을 조정하는 방법인 평점 정규화에 관해서 살펴볼 것입니다.
추천 시스템: 워크북
Comments
Do you have a problem, want to share feedback, or discuss further ideas? Feel free to leave a comment here! Please follow Rust's code of conduct. This comment thread directly maps to a discussion on GitHub, so you can also comment there if you prefer.
Instead of authenticating the giscus application, you can also comment directly on GitHub.