0% found this document useful (0 votes)

13 views8 pages

Code - Recommender System

Uploaded by

f2022332007

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views8 pages

Code - Recommender System

Uploaded by

f2022332007

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

#!

/usr/bin/env python
# coding: utf-8

# In[1]:

import numpy as np
import pandas as pd
import math
import matplotlib.pyplot as plt
import seaborn as sns

# # Data Analysis

# In[2]:

# load data
books = pd.read_csv('Books.csv')
users = pd.read_csv('Users.csv')
ratings = pd.read_csv('Ratings.csv')

# In[3]:

books.head()

# In[4]:

users.head()

# In[5]:

ratings.head()

# In[6]:

books.drop_duplicates(subset=['Book-Title']).shape

# In[7]:
# Get shapes of dataframes
print(books.shape)
print(ratings.shape)
print(users.shape)

# In[8]:

# check for null values

books.isnull().sum()

# In[9]:

# check for null values

users.isnull().sum()

# In[10]:

# check for null values

ratings.isnull().sum()

# In[11]:

# check for any duplicates in dataframes

books.duplicated().sum(), ratings.duplicated().sum(),
users.duplicated().sum()

# In[12]:

# Ratings Stats

print('min rating:', ratings['Book-Rating'].min())

print('max rating:', ratings['Book-Rating'].max())
ratings['Book-Rating'].unique()

# In[13]:

# Merge dataframes
merged_df = pd.merge(ratings, books, on="ISBN")
# In[14]:

# Display basic statistics

print(merged_df.describe())
print()

# Check for missing values

print(merged_df.isnull().sum())

# In[15]:

# Visualize rating distribution

sns.countplot(x='Book-Rating', data=merged_df)
plt.title('Distribution of Book Ratings')
plt.show()

# In[16]:

num_rating_df = merged_df.groupby('Book-Title').count()['Book-
Rating'].reset_index()
num_rating_df.rename(columns = {'Book-Rating':'num_ratings'},
inplace=True)

avg_rating_df = merged_df.groupby('Book-Title').mean()['Book-
Rating'].reset_index()
avg_rating_df.rename(columns = {'Book-Rating':'avg_rating'},
inplace=True)

# In[ ]:

# Visualize rating distribution

sns.countplot(x='Book-Rating', data=merged_df)
plt.title('Distribution of Book Ratings')
plt.show()

# In[ ]:

# Calculate average rating for each book

average_ratings = merged_df.groupby('Book-Title')['Book-
Rating'].mean().reset_index().sort_values(by='Book-
Rating',ascending=False)

# Display top-rated books

print("Top Rated Books:")
print(average_ratings.head(10))

# In[ ]:

average_ratings.head()

# In[ ]:

import matplotlib.pyplot as plt

# Select the top N books for visualization

top_n = 10
top_rated_books = average_ratings.head(top_n)

# Plotting
plt.figure(figsize=(10, 6))
top_rated_books.plot(kind='barh', color='skyblue')
plt.xlabel('Average Rating')
plt.title(f'Top {top_n} Books by Average Rating')
plt.gca().invert_yaxis() # Invert y-axis for better readability
plt.show()

# # Recommender System

# In[ ]:

class RecommendationSystem:

# Constructor
def __init__(self, books_path: str = 'Books.csv', ratings_path: str
= 'Ratings.csv'):
# Load books and ratings data
self.books = pd.read_csv(books_path)
self.ratings = pd.read_csv(ratings_path)
# Initialize matrices and dataframes
self.interaction_matrix = None
self.popular_df = None
self.similarity_scores_matrix = None

# Method to train the recommendation system

def train(self):
# Merge ratings with book information
ratings_with_name = self.ratings.merge(self.books, on='ISBN')

# Compute number of ratings and average rating per book

num_rating_df = ratings_with_name.groupby('Book-Title').count()
['Book-Rating'].reset_index()
num_rating_df.rename(columns={'Book-Rating': 'num_ratings'},
inplace=True)
avg_rating_df = ratings_with_name.groupby('Book-Title').mean()
['Book-Rating'].reset_index()
avg_rating_df.rename(columns={'Book-Rating': 'avg_rating'},
inplace=True)

# Merge rating statistics with books dataset

stats_df = num_rating_df.merge(avg_rating_df, on='Book-Title')
self.books = self.books.merge(stats_df, on='Book-Title')
self.books = self.books.drop_duplicates(subset=['Book-Title'])

# Filter out less popular books

self.popular_df = stats_df[stats_df['num_ratings'] >=
250].sort_values('avg_rating', ascending=False).head(50)
self.popular_df = self.popular_df.merge(self.books, on='Book-
Title').drop_duplicates('Book-Title')
self.popular_df = self.popular_df[['Book-Title', 'Book-Author',
'num_ratings_x', 'avg_rating_x']]
self.popular_df.rename(columns={'num_ratings_x': 'num_ratings',
'avg_rating_x': 'avg_rating'}, inplace=True)

# Identify active users and filter ratings

x = ratings_with_name.groupby('User-ID').count()['Book-Rating']
> 200
active_users = x[x].index
filtered_rating = ratings_with_name[ratings_with_name['User-
ID'].isin(active_users)]

# Identify famous books and filter ratings

y = filtered_rating.groupby('Book-Title').count()['Book-
Rating'] >= 50
famous_books = y[y].index
final_ratings = filtered_rating[filtered_rating['Book-
Title'].isin(famous_books)]

# Create interaction matrix and fill missing values with 0

self.interaction_matrix =
final_ratings.pivot_table(index='Book-Title', columns='User-ID',
values='Book-Rating')
self.interaction_matrix.fillna(0, inplace=True)

# Compute cosine similarity matrix

self.similarity_scores_matrix = self.cosine_similarity()

print("--> Training Complete <--")

# Method to compute cosine similarity using numpy

def cosine_similarity(self):
matrix = np.array(self.interaction_matrix)
dot_product = np.dot(matrix, matrix.T)
norm = np.linalg.norm(matrix, axis=1)
self.similarity_scores_matrix = dot_product / (norm[:, None] *
norm)

return self.similarity_scores_matrix

# Alternative method to compute cosine similarity manually

def cosine_similarity_manual(self):
matrix = np.array(self.interaction_matrix)
num_of_books = matrix.shape[0]
num_of_users = matrix.shape[1]
self.similarity_scores_matrix = np.zeros((num_of_books,
num_of_books))

for i in range(num_of_books):
for j in range(num_of_books):
dot_product = sum(matrix[i][k] * matrix[j][k] for k in
range(num_of_users))
norm_i = math.sqrt(sum(val ** 2 for val in matrix[i]))
norm_j = math.sqrt(sum(val ** 2 for val in matrix[j]))

self.similarity_scores_matrix[i][j] = dot_product /
(norm_i * norm_j)

return self.similarity_scores_matrix

# Method to print popular recommendations

def get_popular_recommendations(self):
for _, row in self.popular_df.iterrows():
for col, value in row.items():
print(f"{col}: {value}")
print()

# Method to get recommendations for a given book

def get_recommendations(self, book_name):
index = np.where(self.interaction_matrix.index == book_name)[0]
[0]
similar_items =
sorted(list(enumerate(self.similarity_scores_matrix[index])),
key=lambda x: x[1], reverse=True)[1:6]

recommendations = []
print(" --> RECOMMENDATIONS <--\n")
for i in similar_items:
book_to_recommend = self.books[self.books['Book-Title'] ==
self.interaction_matrix.index[i[0]]]
title = book_to_recommend['Book-Title'].values[0]
print("Book Title:", title)
author = book_to_recommend['Book-Author'].values[0]
print("Author:", author)
num_rating = book_to_recommend['num_ratings'].values[0]
print("Number of ratings received:", num_rating)
avg_rating = book_to_recommend['avg_rating'].values[0]
print("Average rating:", avg_rating)
print()
recommendations.append((title, author))

return recommendations

# In[ ]:

# Initialize a object for RecommendationSystem

recommender = RecommendationSystem()

# In[ ]:

# Train the recommender

recommender.train()

# In[ ]:

# Get top 5 recommendataions for a book

recommended_books = recommender.get_recommendations('1984')

# In[ ]:
# Get top 50 popular book in the dataset
recommender.get_popular_recommendations()

# In[ ]:

RecommenderSystem File
No ratings yet
RecommenderSystem File
24 pages
Book Recommender System Overview
No ratings yet
Book Recommender System Overview
2 pages
Recommendation Engine 1657857468
No ratings yet
Recommendation Engine 1657857468
15 pages
Assignment 3 AI
No ratings yet
Assignment 3 AI
8 pages
Inn Aat Report
No ratings yet
Inn Aat Report
10 pages
Recommendation System in Python
No ratings yet
Recommendation System in Python
6 pages
Rs 24
No ratings yet
Rs 24
21 pages
DL Project
No ratings yet
DL Project
9 pages
Source Code Book Recommender System
No ratings yet
Source Code Book Recommender System
2 pages
From Surprise Import SVD
No ratings yet
From Surprise Import SVD
2 pages
Your Paragraph Text
No ratings yet
Your Paragraph Text
13 pages
Exp 2
No ratings yet
Exp 2
14 pages
Movie Recommendation System
No ratings yet
Movie Recommendation System
22 pages
Advanced AIML: Association Rules
No ratings yet
Advanced AIML: Association Rules
11 pages
Assignment 5zeerak
No ratings yet
Assignment 5zeerak
6 pages
Chapter 9 - Recommendation Systems
No ratings yet
Chapter 9 - Recommendation Systems
12 pages
Movie Recommendation System KNN (ML-Usecase)
No ratings yet
Movie Recommendation System KNN (ML-Usecase)
7 pages
Project Ai
No ratings yet
Project Ai
12 pages
CCS360 Lab Record
No ratings yet
CCS360 Lab Record
28 pages
KNN Reccomendation
No ratings yet
KNN Reccomendation
7 pages
BOOK Recommendation That Help To Analsis The
No ratings yet
BOOK Recommendation That Help To Analsis The
22 pages
Book Recommendation Project
No ratings yet
Book Recommendation Project
15 pages
Bookrecommendations 230615063942 3b1016c9
No ratings yet
Bookrecommendations 230615063942 3b1016c9
22 pages
Module4.4-Case Study and Project-Recommendation System
No ratings yet
Module4.4-Case Study and Project-Recommendation System
16 pages
41 Perusse Alexander Aperusse PDF
No ratings yet
41 Perusse Alexander Aperusse PDF
7 pages
Assignment 5
No ratings yet
Assignment 5
6 pages
Book Recs for Tech Students
No ratings yet
Book Recs for Tech Students
7 pages
E-commerce Recommendation Guide
No ratings yet
E-commerce Recommendation Guide
17 pages
Bda Mini Project Part2
No ratings yet
Bda Mini Project Part2
24 pages
Movie Recommendation System Overview
No ratings yet
Movie Recommendation System Overview
11 pages
Recommender System Unit Ii
No ratings yet
Recommender System Unit Ii
14 pages
Social Suggest Team Report
No ratings yet
Social Suggest Team Report
52 pages
10 Recommendation Engine Problem Statement
No ratings yet
10 Recommendation Engine Problem Statement
10 pages
9,12,19,68 - ML Assignment-2
No ratings yet
9,12,19,68 - ML Assignment-2
5 pages
Amazon Food Reviews Analysis
No ratings yet
Amazon Food Reviews Analysis
37 pages
Product Recommendation SystemV
No ratings yet
Product Recommendation SystemV
2 pages
Recommendation Chapter2
No ratings yet
Recommendation Chapter2
38 pages
DMDW Fielding Set
No ratings yet
DMDW Fielding Set
11 pages
Chapter 4
No ratings yet
Chapter 4
78 pages
Ex 5
No ratings yet
Ex 5
4 pages
L - AND - T - Project - Naveen 24cs002895
No ratings yet
L - AND - T - Project - Naveen 24cs002895
7 pages
Foundation of Data Science Lab Manual Full
No ratings yet
Foundation of Data Science Lab Manual Full
8 pages
Understanding Recommendation Systems
No ratings yet
Understanding Recommendation Systems
45 pages
Phase-3 Project
No ratings yet
Phase-3 Project
14 pages
Data Mining Assignment Guide
No ratings yet
Data Mining Assignment Guide
3 pages
28.1 - 28.16 Real World Problem - Predict Rating Given Product Reviews On Amazon
No ratings yet
28.1 - 28.16 Real World Problem - Predict Rating Given Product Reviews On Amazon
19 pages
ML
No ratings yet
ML
10 pages
Python Recommender Systems Guide
No ratings yet
Python Recommender Systems Guide
13 pages
Practical File of AI and ML
No ratings yet
Practical File of AI and ML
26 pages
Neel Tyagi Movie Ratings Analysis
No ratings yet
Neel Tyagi Movie Ratings Analysis
12 pages
Python
No ratings yet
Python
22 pages
Music Reccomendation System
No ratings yet
Music Reccomendation System
32 pages
Shopping Cart Recommendation System
No ratings yet
Shopping Cart Recommendation System
8 pages
Neel
No ratings yet
Neel
12 pages
L and T Projects - Colabs
No ratings yet
L and T Projects - Colabs
7 pages
03 Amazon Fine Food Reviews Analysis - KNN
No ratings yet
03 Amazon Fine Food Reviews Analysis - KNN
71 pages
Library Management System Code
No ratings yet
Library Management System Code
7 pages
MLLabcode 1
No ratings yet
MLLabcode 1
3 pages
Homework Blues Sheet Music
100% (1)
Homework Blues Sheet Music
4 pages
How To Set Up MQTT Server For Gateway - Dusun
No ratings yet
How To Set Up MQTT Server For Gateway - Dusun
11 pages
Case Creation The Bob Evans Way - Training
No ratings yet
Case Creation The Bob Evans Way - Training
27 pages
Business Unit Education: Job Description
No ratings yet
Business Unit Education: Job Description
15 pages
String Revision
No ratings yet
String Revision
7 pages
Idmap Generation Retry Failures
No ratings yet
Idmap Generation Retry Failures
245 pages
TrueSTUDIO - A Powerful Eclipse-Based C - C++ Integrated Development Tool For Your STM32 Projects - STMicroelectronics
No ratings yet
TrueSTUDIO - A Powerful Eclipse-Based C - C++ Integrated Development Tool For Your STM32 Projects - STMicroelectronics
4 pages
Idrac-FGJJF82 - IDRAC8 - Lifecycle Log
No ratings yet
Idrac-FGJJF82 - IDRAC8 - Lifecycle Log
2 pages
Laboratory Work No. 2
No ratings yet
Laboratory Work No. 2
6 pages
Open Text Transactional Content Processing 10.0.1 User Guide
No ratings yet
Open Text Transactional Content Processing 10.0.1 User Guide
247 pages
White Paper - EDT05 - Value Stream Maps and
No ratings yet
White Paper - EDT05 - Value Stream Maps and
12 pages
Mil Week 4-5-Wps Office
100% (1)
Mil Week 4-5-Wps Office
3 pages
RC LEC-Getting The Best Out of RC LEC-Overview and RAK
No ratings yet
RC LEC-Getting The Best Out of RC LEC-Overview and RAK
23 pages
Oliii Computer Past Papers Qs
No ratings yet
Oliii Computer Past Papers Qs
43 pages
23escs11 Lab Mannual
No ratings yet
23escs11 Lab Mannual
40 pages
Fortiap v6.0.5 Release Notes
No ratings yet
Fortiap v6.0.5 Release Notes
10 pages
AI in Accounting
No ratings yet
AI in Accounting
20 pages
Generative AI in Cybersecurity: A Comprehensive Review of LLM Applications and Vulnerabilities
No ratings yet
Generative AI in Cybersecurity: A Comprehensive Review of LLM Applications and Vulnerabilities
52 pages
Powerpoint (Unit-6)
No ratings yet
Powerpoint (Unit-6)
8 pages
BM5100ADN - Datasheet
No ratings yet
BM5100ADN - Datasheet
2 pages
Unified Modeling Language
No ratings yet
Unified Modeling Language
20 pages
Multiple Choice Set A
No ratings yet
Multiple Choice Set A
5 pages
Kulik 2021 CemGEMS - An - Easy To Use - Web (Published - Version)
No ratings yet
Kulik 2021 CemGEMS - An - Easy To Use - Web (Published - Version)
17 pages
PAVIRO Factory Default System: Application Note
No ratings yet
PAVIRO Factory Default System: Application Note
5 pages
Steps To Deactivate Activity in Pipeline 1740623841
No ratings yet
Steps To Deactivate Activity in Pipeline 1740623841
12 pages
Robotics & ML Engineer Profile: Parisa Nouri
No ratings yet
Robotics & ML Engineer Profile: Parisa Nouri
3 pages
PowerShell Commands & Features Guide
No ratings yet
PowerShell Commands & Features Guide
4 pages
Mechanical Description
No ratings yet
Mechanical Description
3 pages
00900450-02 UM TRC-fromR22-1 EN
No ratings yet
00900450-02 UM TRC-fromR22-1 EN
128 pages
Frank Vahid - Tony Givargis - Embedded System Design
67% (3)
Frank Vahid - Tony Givargis - Embedded System Design
174 pages

Code - Recommender System

Uploaded by

Code - Recommender System

Uploaded by

#!

# check for null values

# check for null values

# check for null values

# check for any duplicates in dataframes

print('min rating:', ratings['Book-Rating'].min())

# Display basic statistics

# Check for missing values

# Visualize rating distribution

# Visualize rating distribution

# Calculate average rating for each book

# Display top-rated books

import matplotlib.pyplot as plt

# Select the top N books for visualization

# Method to train the recommendation system

# Compute number of ratings and average rating per book

# Merge rating statistics with books dataset

# Filter out less popular books

# Identify active users and filter ratings

# Identify famous books and filter ratings

# Create interaction matrix and fill missing values with 0

# Compute cosine similarity matrix

print("--> Training Complete <--")

# Method to compute cosine similarity using numpy

# Alternative method to compute cosine similarity manually

# Method to print popular recommendations

# Method to get recommendations for a given book

# Initialize a object for RecommendationSystem

# Train the recommender

# Get top 5 recommendataions for a book

You might also like