0% found this document useful (0 votes)

25 views9 pages

Python 3

The document outlines the use of the Seaborn package to load and analyze the 'tips' dataset, including linear and logistic regression models to predict tips and dining times based on various features. It provides evaluation metrics such as Mean Squared Error (MSE) and Root Mean Squared Error (RMSE) for different models. The document also details the structure of the dataset, including columns like total_bill, tip, sex, smoker, day, time, size, and predicted values.

Uploaded by

prakashas404

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

25 views9 pages

Python 3

Uploaded by

prakashas404

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 9

HomeWork

#1. Use Seaborn package to load 'tips' dataset

import seaborn as sns

df = sns.load_dataset('tips')

df.head()

{"summary":"{\n \"name\": \"df\",\n \"rows\": 244,\n \"fields\": [\

n {\n \"column\": \"total_bill\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 8.902411954856856,\n
\"min\": 3.07,\n \"max\": 50.81,\n
\"num_unique_values\": 229,\n \"samples\": [\n 22.12,\
n 20.23,\n 14.78\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"tip\",\n \"properties\": {\n
\"dtype\": \"number\",\n \"std\": 1.3836381890011826,\n
\"min\": 1.0,\n \"max\": 10.0,\n \"num_unique_values\":
123,\n \"samples\": [\n 3.35,\n 1.5,\n
6.73\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n },\n {\n \"column\":
\"sex\",\n \"properties\": {\n \"dtype\": \"category\",\n
\"num_unique_values\": 2,\n \"samples\": [\n
\"Male\",\n \"Female\"\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"smoker\",\n \"properties\":
{\n \"dtype\": \"category\",\n \"num_unique_values\":
2,\n \"samples\": [\n \"Yes\",\n \"No\"\n
],\n \"semantic_type\": \"\",\n \"description\": \"\"\n
}\n },\n {\n \"column\": \"day\",\n \"properties\": {\
n \"dtype\": \"category\",\n \"num_unique_values\": 4,\n
\"samples\": [\n \"Sat\",\n \"Fri\"\n ],\n
\"semantic_type\": \"\",\n \"description\": \"\"\n }\
n },\n {\n \"column\": \"time\",\n \"properties\": {\n
\"dtype\": \"category\",\n \"num_unique_values\": 2,\n
\"samples\": [\n \"Lunch\",\n \"Dinner\"\
n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n },\n {\n \"column\":
\"size\",\n \"properties\": {\n \"dtype\": \"number\",\n
\"std\": 0,\n \"min\": 1,\n \"max\": 6,\n
\"num_unique_values\": 6,\n \"samples\": [\n 2,\n
3\n ],\n \"semantic_type\": \"\",\n
\"description\": \"\"\n }\n }\n ]\
n}","type":"dataframe","variable_name":"df"}

LINEAR MODEL
predict_tip = f(total_bill)

Model 1 when m = 0.1 and c = -0.5

m = 0.1
c = -0.5

df['predicted_tip'] = df['total_bill'] * m + c

{"summary":"{\n \"name\": \"df\",\n \"rows\": 244,\n \"fields\": [\

# Evaluation metrics

import numpy as np

mse = ((df['tip'] - df['predicted_tip'])**2).mean()

rmse = np.sqrt(mse)

print(f'MSE : {mse:.2f}\nRMSE : {rmse:.2f}')

MSE : 3.35
RMSE : 1.83

Model 2 when m = 0.05 and c = 0.1

m = 0.05
c = 0.1

df['predicted_tip'] = df['tip'] * m + c

{"summary":"{\n \"name\": \"df\",\n \"rows\": 244,\n \"fields\": [\

# Evaluation metrics

mse = ((df['tip'] - df['predicted_tip'])**2).mean()

rmse = np.sqrt(mse)

print(f'MSE : {mse:.2f}\nRMSE : {rmse:.2f}')

MSE : 9.27
RMSE : 3.05

LOGISTIC REGRESSION

time = f(tip)

df = sns.load_dataset('tips')

m = 0.07
c = -0.8

def sigmoid(z):
return 1 / (1 + np.exp(-z))

df['prob_dinner'] = sigmoid(df['tip'] * m + c)

df['predicted_time'] = (df['prob_dinner'] >= 5).astype(int)

{"summary":"{\n \"name\": \"df\",\n \"rows\": 244,\n \"fields\": [\

df['actual_time'] = (df['time'] == 'Dinner').astype(int)

TP = ((df['actual_time'] == 1) & (df['predicted_time'] == 1)).sum()

FP = ((df['actual_time'] == 0) & (df['predicted_time'] == 1)).sum()
FN = ((df['actual_time'] == 1) & (df['predicted_time'] == 0)).sum()
precision = TP / (TP + FP) if (TP + FP) != 0 else 0
recall = TP / (TP + FN) if (TP + FN) != 0 else 0

print(f'Precision : {precision:.4f}')
print(f'Recall : {recall:.4f}')

Precision : 0.0000
Recall : 0.0000

DECISION TREE

1. Basic (Dinner if tip > 1.2)

df = sns.load_dataset('tips')

df['actual_time'] = (df['time'] == 'Dinner').astype(int)

threshold = 1.2
df['predicted_time_DT'] = (df['tip'] > threshold).astype(int)

TP = ((df['actual_time'] == 1) * (df['predicted_time_DT'] == 1)).sum()

FP = ((df['actual_time'] == 0) * (df['predicted_time_DT'] == 1)).sum()
FN = ((df['actual_time'] == 1) * (df['predicted_time_DT'] == 0)).sum()

precision = TP / (TP + FP) if (TP + FP) else 0

recall = TP / (TP + FN) if (TP + FN) else 0

print(f'Precision : {precision:.4f}')
print(f'Recall : {recall:.4f}')

Precision : 0.7131
Recall : 0.9602

{"summary":"{\n \"name\": \"df\",\n \"rows\": 244,\n \"fields\": [\

df = sns.load_dataset('tips')

df['actual_time'] = (df['time'] == 'Dinner').astype(int)

mask1 = (df['tip'] < 1.5) & (df['total_bill'] < 10)

mask2 = (df['tip'] >= 1.5) & (df['tip'] < 4.5) & (df['total_bill'] <
12)

mask3 = (df['tip'] >= 1.5) & (df['tip'] >= 4.5) & (df['total_bill'] <
19)

df['predicted_time_DT2'] = (mask1 | mask2 | mask3).astype(int)

TP = ((df['actual_time'] == 1) * (df['predicted_time_DT2'] ==
1)).sum()
FP = ((df['actual_time'] == 0) * (df['predicted_time_DT2'] ==
1)).sum()
FN = ((df['actual_time'] == 1) * (df['predicted_time_DT2'] ==
0)).sum()

precision = TP / (TP + FP) if (TP + FP) != 0 else 0

recall = TP / (TP + FN) if (TP + FN) != 0 else 0

print(f'Precision : {precision:.4f}')
print(f'recall : {recall:.4f}')

Precision : 0.5676
recall : 0.1193

import seaborn as sns

import matplotlib.pyplot as plt
import pandas as pd

# Load dataset locally

df = sns.load_dataset("tips") # works if you're online

# Label: 1 = Dinner, 0 = Lunch

df["actual_time"] = (df["time"] == "Dinner").astype(int)

# Decision logic
mask1 = (df["tip"] < 1.5) & (df["total_bill"] < 10)
mask2 = (df["tip"] >= 1.5) & (df["tip"] < 4.5) & (df["total_bill"] <
12)
mask3 = (df["tip"] >= 4.5) & (df["total_bill"] < 19)

df["predicted_time_DT2"] = (mask1 | mask2 | mask3).astype(int)

# ────────────────────────────────
# Plot 1: Actual classification
# Plot 2: Predicted classification
# ────────────────────────────────
plt.figure(figsize=(12, 5))

# Actual
plt.subplot(1, 2, 1)
sns.scatterplot(
data=df,
x="total_bill",
y="tip",
hue="actual_time",
palette={0: "red", 1: "green"},
style="actual_time"
)
plt.title("Actual Time (Dinner=1, Lunch=0)")
plt.xlabel("Total Bill")
plt.ylabel("Tip")

# Predicted
plt.subplot(1, 2, 2)
sns.scatterplot(
data=df,
x="total_bill",
y="tip",
hue="predicted_time_DT2",
palette={0: "red", 1: "green"},
style="predicted_time_DT2"
)
plt.title("Predicted Time (DT2)")
plt.xlabel("Total Bill")
plt.ylabel("Tip")

plt.tight_layout()
plt.show()

VoThaiThaoNhi ECON209 F2024 Lab 2
No ratings yet
VoThaiThaoNhi ECON209 F2024 Lab 2
10 pages
Import As Import As Import As Import: Pandas PD Numpy NP Matplotlib - Pyplot PLT Sklearn DF PD - Read - CSV DF
No ratings yet
Import As Import As Import As Import: Pandas PD Numpy NP Matplotlib - Pyplot PLT Sklearn DF PD - Read - CSV DF
9 pages
Assignment 1 ML
No ratings yet
Assignment 1 ML
30 pages
BD WPS2
No ratings yet
BD WPS2
23 pages
ML Lab-1
No ratings yet
ML Lab-1
5 pages
Lab2
No ratings yet
Lab2
15 pages
IS - Extended - Project - Guided - Template - Notebook
No ratings yet
IS - Extended - Project - Guided - Template - Notebook
26 pages
DACLUSTER
No ratings yet
DACLUSTER
9 pages
# Importing Necessary Libraries: Import As Import As Import As Import As
No ratings yet
# Importing Necessary Libraries: Import As Import As Import As Import As
21 pages
Kakauikkla
No ratings yet
Kakauikkla
51 pages
Copy of Final Project
No ratings yet
Copy of Final Project
16 pages
Loan Default Prediction System
No ratings yet
Loan Default Prediction System
13 pages
Copy of ML - Assignment
No ratings yet
Copy of ML - Assignment
7 pages
Week 4
No ratings yet
Week 4
13 pages
MLT Ann Lab 2
No ratings yet
MLT Ann Lab 2
7 pages
Task 1
No ratings yet
Task 1
5 pages
Covid 19 Analysis and Visualization Using Plotly Express
No ratings yet
Covid 19 Analysis and Visualization Using Plotly Express
11 pages
CVD Web
No ratings yet
CVD Web
22 pages
Plot 3D: Import As
No ratings yet
Plot 3D: Import As
26 pages
Supply Chain Analytics
No ratings yet
Supply Chain Analytics
20 pages
Bose A S
No ratings yet
Bose A S
37 pages
KNN For Classification
No ratings yet
KNN For Classification
5 pages
Another Copy of Ensemble Models Original Paid
No ratings yet
Another Copy of Ensemble Models Original Paid
51 pages
21mic0107 1
No ratings yet
21mic0107 1
7 pages
RegresiÃ N Lineal Con Python - Ipynb
No ratings yet
RegresiÃ N Lineal Con Python - Ipynb
83 pages
Keeratsi HW8
No ratings yet
Keeratsi HW8
17 pages
Projet 2 Classification Des Crédits
No ratings yet
Projet 2 Classification Des Crédits
24 pages
Code Nhóm 1 FGDFG
No ratings yet
Code Nhóm 1 FGDFG
14 pages
Da Lab3 221it084 Final
No ratings yet
Da Lab3 221it084 Final
6 pages
1 Linear Regression - Ipynb
No ratings yet
1 Linear Regression - Ipynb
66 pages
Tathagat Upi
No ratings yet
Tathagat Upi
34 pages
Lab Program 3
No ratings yet
Lab Program 3
6 pages
1 Linear Regression - Ipynb
No ratings yet
1 Linear Regression - Ipynb
16 pages
Data Scientists' Guide to Predicting House Prices
No ratings yet
Data Scientists' Guide to Predicting House Prices
9 pages
Ass 1 ML
No ratings yet
Ass 1 ML
21 pages
Model
No ratings yet
Model
5 pages
PRGM 4
No ratings yet
PRGM 4
3 pages
Assignment 4
No ratings yet
Assignment 4
7 pages
Delhivery Data Processing Overview
No ratings yet
Delhivery Data Processing Overview
79 pages
1 Abril PDF
No ratings yet
1 Abril PDF
10 pages
1 4-EDA Ipynb
No ratings yet
1 4-EDA Ipynb
12 pages
PRG 4
No ratings yet
PRG 4
2 pages
Alishba (S005)
No ratings yet
Alishba (S005)
5 pages
ASSESSMENT2
No ratings yet
ASSESSMENT2
22 pages
775 (Copy)
No ratings yet
775 (Copy)
5 pages
Experiment No 11
No ratings yet
Experiment No 11
19 pages
House Price Prediction Analysis
No ratings yet
House Price Prediction Analysis
18 pages
Ashwin Report
No ratings yet
Ashwin Report
18 pages
Cleaning Data
No ratings yet
Cleaning Data
6 pages
Kidney Ipynb
No ratings yet
Kidney Ipynb
253 pages
Building A Decision Tree: Takeaways: Syntax
No ratings yet
Building A Decision Tree: Takeaways: Syntax
3 pages
ASSESSMENT2
No ratings yet
ASSESSMENT2
22 pages
Decision Tree
No ratings yet
Decision Tree
4 pages
221IT027 DA Lab3
No ratings yet
221IT027 DA Lab3
5 pages
Da Lab3 221it064
No ratings yet
Da Lab3 221it064
6 pages
Energies 18 01463
No ratings yet
Energies 18 01463
20 pages
In Nic Kar kseeb-SSCER-202020200778781
No ratings yet
In Nic Kar kseeb-SSCER-202020200778781
1 page
CHO Adv - Eng. 2023
No ratings yet
CHO Adv - Eng. 2023
11 pages
Wa0038.
No ratings yet
Wa0038.
6 pages
Wa0036.
No ratings yet
Wa0036.
8 pages
Clean IPMB
No ratings yet
Clean IPMB
1 page
Untitled Report
No ratings yet
Untitled Report
2 pages
First Assignment Questions Submission Date 28 March 2025
No ratings yet
First Assignment Questions Submission Date 28 March 2025
1 page
CSE3343 CC QB Module 1,2 New
No ratings yet
CSE3343 CC QB Module 1,2 New
7 pages
CSE3343 CC QB Module 1,2 New
No ratings yet
CSE3343 CC QB Module 1,2 New
7 pages
ICT Study Material
No ratings yet
ICT Study Material
12 pages
Ls-Dyna Manual Volume II r13
No ratings yet
Ls-Dyna Manual Volume II r13
1,993 pages
VSX-S520 - Manual Receiver Pioneer
No ratings yet
VSX-S520 - Manual Receiver Pioneer
485 pages
Wireshark Lab 1.2 Import and Examine PCAP File (V1.1)
No ratings yet
Wireshark Lab 1.2 Import and Examine PCAP File (V1.1)
9 pages
AI Mavericks (5 - To - 8)
No ratings yet
AI Mavericks (5 - To - 8)
17 pages
R in Clinical Research: A Comprehensive Guide
100% (5)
R in Clinical Research: A Comprehensive Guide
376 pages
C# Basic Fundamentals
No ratings yet
C# Basic Fundamentals
3 pages
Mikrotik HTTPS PDF
No ratings yet
Mikrotik HTTPS PDF
20 pages
Backup: (Note 1)
No ratings yet
Backup: (Note 1)
20 pages
XXXXXXXXXXXXXXXXXX: This Manual Was Downloaded From BAMA's Boatanchor Site
No ratings yet
XXXXXXXXXXXXXXXXXX: This Manual Was Downloaded From BAMA's Boatanchor Site
67 pages
Global Notice Inviting Tender (Nit) - E-Tender
No ratings yet
Global Notice Inviting Tender (Nit) - E-Tender
1 page
School Management System Site
No ratings yet
School Management System Site
4 pages
Analyzing Function Continuity
No ratings yet
Analyzing Function Continuity
49 pages
AR in RETAIL Sector Report September 2019 v1.21 by STIQ
No ratings yet
AR in RETAIL Sector Report September 2019 v1.21 by STIQ
35 pages
Unit V - Activity and Multimedia With Databases: Intent
No ratings yet
Unit V - Activity and Multimedia With Databases: Intent
53 pages
Decision Tree: Pros, Cons, and Applications
No ratings yet
Decision Tree: Pros, Cons, and Applications
2 pages
Apriliani - BSBTWK503 - Assessment Task 2 Project Portfolio
No ratings yet
Apriliani - BSBTWK503 - Assessment Task 2 Project Portfolio
32 pages
AXITEC AC-250P/156-60S Module Specs
No ratings yet
AXITEC AC-250P/156-60S Module Specs
2 pages
SAP Best Practices Guide
No ratings yet
SAP Best Practices Guide
16 pages
FitShow App User Guide
No ratings yet
FitShow App User Guide
9 pages
Asco LV Ats & PCS
No ratings yet
Asco LV Ats & PCS
59 pages
Analog Electronics Circuits (3rd Sem) 27-03-2025
100% (3)
Analog Electronics Circuits (3rd Sem) 27-03-2025
299 pages
Recruitment Advt.022024
No ratings yet
Recruitment Advt.022024
14 pages
Y10 03 CT15 Activities Solutions
No ratings yet
Y10 03 CT15 Activities Solutions
4 pages
MRTG Server Monitoring Guide
No ratings yet
MRTG Server Monitoring Guide
15 pages
Spectrofotometer Cary PDF
No ratings yet
Spectrofotometer Cary PDF
16 pages
Idiots Clients
No ratings yet
Idiots Clients
137 pages
Frequency Domain Filters
No ratings yet
Frequency Domain Filters
43 pages
PMP ITTO Process Chart PMBOK Guide 6th Edition-1a
No ratings yet
PMP ITTO Process Chart PMBOK Guide 6th Edition-1a
14 pages
Cadworx & Analysis Solutions: Intergraph
No ratings yet
Cadworx & Analysis Solutions: Intergraph
8 pages