html
효과적인 도서 추천 시스템 구축: 단계별 가이드
목차
안녕하세요, 친구들! 오늘의 토론에서는 강력한 도서 추천 시스템을 구축하는 복잡한 과정에 대해 깊이 탐구해보겠습니다. 특히, 긍정적인 상관관계를 기반으로 최적의 도서를 선택하고, 정확성과 관련성을 위해 추천을 최적화하는 방법을 살펴보겠습니다.
상관관계 이해하기
우리는 "The Painted House"와 일정 수준의 상관관계를 보이는 1,587권의 도서로 구성된 데이터셋을 시작점으로 삼습니다. 주된 목표는 강한 긍정 상관관계를 가진 도서를 식별하고 선택하여 사용자에게 관련성 있고 가치 있는 추천을 제공하는 것입니다.
평점 데이터 향상
이를 달성하기 위해 기존의 평점 테이블을 정제할 것입니다. 우리의 평점 테이블에는 다음 항목이 포함됩니다:
- 평균 평점: 각 도서가 받은 평균 평점
- 평점 수: 도서별 총 평점 수
- ISBN: 각 도서의 고유 식별자
평점 테이블을 초기 결과와 조인함으로써 중요한 평점 정보를 추가하여 추천에 대한 보다 종합적인 기초를 마련합니다.
조인 구현하기
조인 작업을 수행하는 방법은 다음과 같습니다:
- 결과 추출: "Painted House Similar Books" 데이터셋으로 시작합니다.
- ISBN으로 조인: ISBN을 키로 사용하여 이 데이터셋을 평점 테이블과 병합합니다. 이를 통해 각 도서와 올바른 평점이 일치하도록 합니다.
1
painted_house_similar_books = painted_house_similar_books.join(ratings, on='ISBN')
조인을 실행한 후, 우리의 데이터셋에는 상관점수, 도서 평점, 및 평점 수가 포함됩니다.
추가 도서 정보 통합
데이터셋을 더욱 향상시키기 위해 다음과 같은 추가 세부 정보를 추가할 것입니다:
- 도서 제목
- 도서 저자
ISBN이 처음에 도서 정보 테이블의 키로 설정되어 있지 않기 때문에 조인을 용이하게 하기 위해 먼저 ISBN을 인덱스로 설정할 것입니다:
12
bx_book.set_index('ISBN', inplace=True)painted_house_similar_books = painted_house_similar_books.join(bx_book[['Book Title', 'Book Author']], on='ISBN')
추천 최적화 및 정렬
향상된 데이터셋을 사용하여 다음 단계는 상위 추천을 강조하기 위해 도서를 정렬하는 것입니다:
- 상관관계 및 평점 수로 정렬: 더 높은 상관관계 점수와 더 많은 평점을 받은 도서를 우선시합니다.
- 내림차순 정렬: 상관관계와 평점 수 모두를 내림차순으로 정렬하여 가장 관련성 높은 도서를 표시합니다.
12
painted_house_similar_books_sorted = painted_house_similar_books.sort_values(by=['correlation', 'rating_count'], ascending=[False, False])top_10_recommendations = painted_house_similar_books_sorted.head(10)
상위 추천 검토
분석을 기반으로 한 상위 10개 추천 도서는 다음과 같습니다:
- The Painted House by John Grisham
- Harry Potter Series by J.K. Rowling
- Stephen King - 다양한 제목
- Tom Clancy - 다양한 제목
- Iris Johansen - 다양한 제목
- Lisa Gardner - 다양한 제목
- The Angel of Darkness
- Harry Potter and the Prisoner of Azkaban
- Heart of Atlantis
- Fictional Thriller Titles
이러한 추천은 스릴러, 미스터리, 서스펜스, 및 픽션 등 장르와 잘 맞아 추천 시스템의 효과를 검증합니다.
추천 검증하기
시스템의 정확성을 보장하기 위해:
- 장르 일관성: "The Angel of Darkness"와 "Harry Potter and the Prisoner of Azkaban"과 같은 도서는 각각 스릴러 및 미스터리 장르에 속합니다.
- 저자 유사성: Stephen King과 Tom Clancy와 같은 추천된 저자는 John Grisham과 스타일 및 주제에서 유사성을 공유하여 추천의 관련성을 높입니다.
다음 단계
현재 시스템은 존재하는 데이터셋에서 잘 작동하지만, 이 데이터에만 특화되어 있습니다. 적용 범위를 확장하려면:
- 핵심 개념 이해: 추천 알고리즘의 기본 원리를 이해합니다.
- 커스텀 코드 구현: 서로 다른 데이터셋과 요구사항에 맞게 코드를 조정하고 확장합니다.
- 과제: MovieLens 데이터셋을 사용하여 추천 시스템을 만듭니다. 데이터셋과 추가 자료는 Analytics India Magazine에서 확인하세요.
결론
우리의 추천 시스템은 긍정적인 상관관계와 강력한 평점 지표를 기반으로 도서를 효과적으로 식별하고 순위를 매깁니다. 이러한 단계를 따르면 다양한 데이터셋과 사용자 선호에 맞춘 개인화되고 신뢰할 수 있는 추천 엔진을 구축할 수 있습니다.
다음 동영상에서는 추천 시스템을 더욱 향상시키기 위한 추가 기능 및 최적화를 탐구할 예정입니다. 시청해 주셔서 감사합니다. 좋은 하루 되세요!