-
Surprise 주요 모듈Python Machine Learning/추천 시스템 2021. 1. 21. 22:38
1. os 파일 데이터를 Surprise 데이터 세트로 로딩
- Dataset.load_from_file( file_path, reader )
: 콤마, 탭등으로 칼럼이 분리된 포맷의 os 파일에서 데이터를 로딩
: 입력 파라미터로 OS 파일명, Reader로 파일의 포맷을 지정
ratings_noh.csv 파일로 unload 시 index 와 header를 모두 제거한 새로운 파일 생성. - os 파일 로딩할 때 로딩되는 데이터 파일에 칼럼명을 가지는 헤더 문자열이 존재하면 안됨.
데이터 파일의 파싱 포맷 정의 - Reader 클래스의 생성자에 필드의 칼럼명, 분리문자, 최소~최대 평점을 입력하여 객체 생성하고, load_from_file( )로 Reader 객체를 참조해 데이터 파일 파싱 및 로딩.
- Surprise는 사용자, 아이템 아이디, 평점 데이터가 로우 레벨로 된 데이터 세트만 적용할 수 있기 때문에 여기서 앞의 3개 칼럼만 로딩되고 timestamp 칼럼은 제외됨.
SVD로 학습후 테스트데이터 평점 예측 후 RMSE평가 2. 판다스 데이터프레임에서 Surprise 데이터 세트로 로딩
판다스 데이터프레임 기반에서 동일하게 재 수행 'Python Machine Learning > 추천 시스템' 카테고리의 다른 글
Surprise를 이용한 개인화 영화 추천 시스템 구축 (0) 2021.01.22 추천 시스템 패키지 - Surprise (0) 2021.01.21 아이템 기반 최근접 이웃 협업 필터링 추천 시스템 실습 (0) 2021.01.20 콘텐츠 기반 추천 시스템 실습 (0) 2021.01.19