Data Analytics II

The document outlines a laboratory exercise for a Data Science and Big Data Analytics course, focusing on using Logistic Regression for predicting purchases based on age and estimated salary. It details the steps of loading a dataset, preprocessing data, training a model, making predictions, and evaluating performance using a confusion matrix. Key metrics such as accuracy, precision, and recall are computed to assess the model's effectiveness.

Uploaded by

Chirag Patekar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

31 views4 pages

Data Analytics II

Uploaded by

Chirag Patekar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

Third Year Engineering (2019 Pattern)

Course Code: 310256

Course Name: Data Science and Big Data Analytics Laboratory
Group A
4) Data Analytics II
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, accuracy_score, precision_score,
recall_score

# Step 1: Load the dataset

df = pd.read_csv("Social_Network_Ads.csv")
print("\nDataset Info:")
print(df.info())
print("\nFirst 5 Rows:")
print(df.head())

# Step 2: Data Preprocessing

# Selecting relevant features and target variable
X = df[['Age', 'EstimatedSalary']]
y = df['Purchased'] # Target variable
# Splitting dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Feature Scaling
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Step 3: Train Logistic Regression Model

model = LogisticRegression()
model.fit(X_train_scaled, y_train)

# Step 4: Make Predictions

y_pred = model.predict(X_test_scaled)

# Step 5: Compute Confusion Matrix

conf_matrix = confusion_matrix(y_test, y_pred)
tn, fp, fn, tp = conf_matrix.ravel()
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
error_rate = 1 - accuracy

# Step 6: Display Results

print("\nConfusion Matrix:")
print(conf_matrix)
print(f"\nTrue Positives (TP): {tp}")
print(f"False Positives (FP): {fp}")
print(f"True Negatives (TN): {tn}")
print(f"False Negatives (FN): {fn}")
print(f"Accuracy: {accuracy:.2f}")
print(f"Error Rate: {error_rate:.2f}")
print(f"Precision: {precision:.2f}")
print(f"Recall: {recall:.2f}")
Explanation of Each Step:
1. Loading the Dataset
o Read Social_Network_Ads.csv into a Pandas DataFrame.
2. Data Preprocessing
o Selected Age and EstimatedSalary as features.
o Used Purchased as the target variable.
o Applied StandardScaler() for feature scaling.
3. Splitting the Data
o Split into 80% training and 20% testing using train_test_split().
4. Training the Model
o Trained a Logistic Regression model using LogisticRegression().
5. Making Predictions
o Predicted labels for the test set using .predict().
6. Computing the Confusion Matrix
o Extracted True Positives (TP), False Positives (FP), True Negatives (TN),
False Negatives (FN).
o Calculated Accuracy, Error Rate, Precision, and Recall.

OUTPUT-

Assignment 9
No ratings yet
Assignment 9
2 pages
Customer Churn Prediction Model
No ratings yet
Customer Churn Prediction Model
6 pages
Data Analytics I
No ratings yet
Data Analytics I
4 pages
Machine Learning Hands-On
100% (1)
Machine Learning Hands-On
18 pages
A3 Classification and Feature Engineering
No ratings yet
A3 Classification and Feature Engineering
2 pages
30 Days ML Projects Challenge
No ratings yet
30 Days ML Projects Challenge
288 pages
Easy Pract ML
No ratings yet
Easy Pract ML
7 pages
Machine Learning Strategies
No ratings yet
Machine Learning Strategies
59 pages
Capstone Project - Jaro-Prof. Babji
No ratings yet
Capstone Project - Jaro-Prof. Babji
5 pages
Home Work
No ratings yet
Home Work
12 pages
Machine Learning Lab Manual 2021-22
No ratings yet
Machine Learning Lab Manual 2021-22
23 pages
Articles Xgboost Classification With Smote-Enn Algorithm
No ratings yet
Articles Xgboost Classification With Smote-Enn Algorithm
11 pages
ML Lab Programs
No ratings yet
ML Lab Programs
9 pages
Dsbda 5
No ratings yet
Dsbda 5
4 pages
Machine Learning Course Overview
No ratings yet
Machine Learning Course Overview
2 pages
Data Analytcs 2
No ratings yet
Data Analytcs 2
2 pages
Experiment 5
No ratings yet
Experiment 5
2 pages
2021BCS0103 ML
No ratings yet
2021BCS0103 ML
1 page
ML Adv
No ratings yet
ML Adv
51 pages
Reflective Journal Writing 6 - 1733814927
No ratings yet
Reflective Journal Writing 6 - 1733814927
4 pages
ML External Xerox
No ratings yet
ML External Xerox
1 page
# Use This Cell To Write Your Code
No ratings yet
# Use This Cell To Write Your Code
2 pages
DS Food
No ratings yet
DS Food
23 pages
Machine Learning Internship Report
No ratings yet
Machine Learning Internship Report
13 pages
Machine Learning PBL
No ratings yet
Machine Learning PBL
9 pages
Mltee t5 Assignment Pseudo Code
No ratings yet
Mltee t5 Assignment Pseudo Code
10 pages
ML Complete Notes Hridoy
No ratings yet
ML Complete Notes Hridoy
5 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
ML Manual With Outputs
No ratings yet
ML Manual With Outputs
30 pages
Ds Assign 33
No ratings yet
Ds Assign 33
7 pages
Banking Marketing Target Prediction
No ratings yet
Banking Marketing Target Prediction
13 pages
PA Lab2
No ratings yet
PA Lab2
11 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
43 pages
Classification
No ratings yet
Classification
3 pages
B.Tech AI & DS: Data Science Lab
No ratings yet
B.Tech AI & DS: Data Science Lab
35 pages
Machine Learning Path
No ratings yet
Machine Learning Path
21 pages
ML Surya
No ratings yet
ML Surya
19 pages
Final-12-Lab Programs
No ratings yet
Final-12-Lab Programs
30 pages
C2W3 Lab 01 Model Evaluation and Selection
No ratings yet
C2W3 Lab 01 Model Evaluation and Selection
21 pages
C2W3 Lab 01 Model Evaluation and Selection
No ratings yet
C2W3 Lab 01 Model Evaluation and Selection
21 pages
Lab Manual 04
No ratings yet
Lab Manual 04
12 pages
Machine Intelligence
No ratings yet
Machine Intelligence
24 pages
Beginner's Guide to Machine Learning
No ratings yet
Beginner's Guide to Machine Learning
8 pages
Document 4
No ratings yet
Document 4
3 pages
3 Month AI Architect Learning Program
No ratings yet
3 Month AI Architect Learning Program
3 pages
Data Analytics Program
No ratings yet
Data Analytics Program
11 pages
A09Ass05 - Jupyter Notebook
No ratings yet
A09Ass05 - Jupyter Notebook
15 pages
Assignment 3
No ratings yet
Assignment 3
8 pages
Assignment 2: Hive
No ratings yet
Assignment 2: Hive
11 pages
Supervised Learning
100% (1)
Supervised Learning
15 pages
Datascience PR 6 Veda
No ratings yet
Datascience PR 6 Veda
6 pages
Cars Project PDF
No ratings yet
Cars Project PDF
9 pages
About The Dataset - Car Evaluation Dataset (UCI Machine Learning Repository
No ratings yet
About The Dataset - Car Evaluation Dataset (UCI Machine Learning Repository
5 pages
Logistic Regression
No ratings yet
Logistic Regression
2 pages
ML Theory
No ratings yet
ML Theory
5 pages
Titanic Data Analysis with Python
No ratings yet
Titanic Data Analysis with Python
20 pages
DBMS Lab Manual 2025-26
No ratings yet
DBMS Lab Manual 2025-26
53 pages
SPOS Course File 2024-25
No ratings yet
SPOS Course File 2024-25
27 pages
Uhvpe Assignment 3 & 4
No ratings yet
Uhvpe Assignment 3 & 4
2 pages
Practical Activity Day 1
No ratings yet
Practical Activity Day 1
2 pages
Dbms Mini Project Booklet
No ratings yet
Dbms Mini Project Booklet
15 pages
Hypothesis PDF
No ratings yet
Hypothesis PDF
37 pages
Triangle Test Statistics Table
No ratings yet
Triangle Test Statistics Table
1 page
Econometrics I: Course Overview
No ratings yet
Econometrics I: Course Overview
3 pages
Data Analytics: Regression Modeling Overview
No ratings yet
Data Analytics: Regression Modeling Overview
24 pages
Becs-184 HM 2024-25 KP
No ratings yet
Becs-184 HM 2024-25 KP
26 pages
Case Processing Summary: N % Cases Valid Excluded Total
No ratings yet
Case Processing Summary: N % Cases Valid Excluded Total
4 pages
Week 4 Written Assignment
No ratings yet
Week 4 Written Assignment
3 pages
Measures of Dispersion - Notes
No ratings yet
Measures of Dispersion - Notes
5 pages
MSA Reference Manual 4th Edition
100% (5)
MSA Reference Manual 4th Edition
241 pages
Lec1-Lecture Advance Statistics
No ratings yet
Lec1-Lecture Advance Statistics
38 pages
ML Mid Sem Question Bank
No ratings yet
ML Mid Sem Question Bank
11 pages
Internal Consistency in Assessment
No ratings yet
Internal Consistency in Assessment
9 pages
NFL-225 Test Predicts Bench Press Strength
No ratings yet
NFL-225 Test Predicts Bench Press Strength
5 pages
Chapter 14. Supplemental Text Material S14-1. The Staggered, Nested Design
No ratings yet
Chapter 14. Supplemental Text Material S14-1. The Staggered, Nested Design
4 pages
FDS Model ExamQP
No ratings yet
FDS Model ExamQP
2 pages
18MAB303T - Testing Hypothesis - Basics 2023
No ratings yet
18MAB303T - Testing Hypothesis - Basics 2023
25 pages
Ph.D. Research Methodology Guide
No ratings yet
Ph.D. Research Methodology Guide
5 pages
Statistical Analysis of Coin Weights
67% (3)
Statistical Analysis of Coin Weights
6 pages
Stats Group 1 Peta
No ratings yet
Stats Group 1 Peta
19 pages
Regression Analysis Solutions
No ratings yet
Regression Analysis Solutions
5 pages
Math Model Validation Worksheet
100% (1)
Math Model Validation Worksheet
3 pages
Experimental Design Basics
No ratings yet
Experimental Design Basics
40 pages
B 8.2 Two-Way ANOVA
No ratings yet
B 8.2 Two-Way ANOVA
10 pages
Coca-Cola Global Growth and Statistics
No ratings yet
Coca-Cola Global Growth and Statistics
3 pages
Chapter 8
No ratings yet
Chapter 8
3 pages
PERT AON Questions
No ratings yet
PERT AON Questions
9 pages
Analysis of Longitudinal Data Second Edition Peter Diggle PDF Download
100% (3)
Analysis of Longitudinal Data Second Edition Peter Diggle PDF Download
49 pages
ML Unit1 6
No ratings yet
ML Unit1 6
3 pages
Elements of Statistics BCA Sem-I.
No ratings yet
Elements of Statistics BCA Sem-I.
46 pages
Standardized Testing: Lyn and Bacon
No ratings yet
Standardized Testing: Lyn and Bacon
41 pages