0% found this document useful (0 votes)

27 views2 pages

Week1 Code Corrected

The document loads diabetes-related data from an Excel file, analyzes it by finding means, null values, outliers, and replaces nulls with means before further exploration.

Uploaded by

aravindsv368

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views2 pages

Week1 Code Corrected

The document loads diabetes-related data from an Excel file, analyzes it by finding means, null values, outliers, and replaces nulls with means before further exploration.

Uploaded by

aravindsv368

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

import numpy as np

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split,GridSearchCV,cross_val_score
import seaborn as sns
from sklearn.metrics import
accuracy_score,mean_squared_error,classification_report,confusion_matrix,precision_
score,recall_score,roc_curve,auc
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
from sklearn.ensemble import ExtraTreesClassifier,RandomForestClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.naive_bayes import GaussianNB
from sklearn.preprocessing import StandardScaler,MinMaxScaler
from sklearn.neighbors import KNeighborsClassifier

data=pd.read_excel('health care diabetes.xlsx')

data.head()

data.describe()

#Identifying the mean of the features

print(data['Glucose'].mean())
print(data['BloodPressure'].mean())
print(data['SkinThickness'].mean())
print(data['Insulin'].mean())
print(data['Pregnancies'].mean())
print(data['BMI'].mean())

# Finding the number of rows which has the null values

print('Glucose-',len(data['Glucose'][data['Glucose']==0]))
print('BloodPressure-',len(data['BloodPressure'][data['BloodPressure']==0]))
print('SkinThickness-',len(data['SkinThickness'][data['SkinThickness']==0]))
print('Insulin-',len(data['Insulin'][data['Insulin']==0]))
print('Pregnancies-',len(data['Pregnancies'][data['Pregnancies']==0]))
print('BMI-',len(data['BMI'][data['BMI']==0]))

# Finding the null value percentage

selected_columns = ['Glucose', 'BloodPressure',
'SkinThickness','Insulin','Pregnancies','BMI']
null_percentage = (data[selected_columns] == 0).mean() * 100

# Displaying the null value percentage for each selected column

print("Percentage of Null Values for Each Column:")
print(null_percentage)

# Replacing the null values with the mean

data['Glucose']=data['Glucose'].replace([0],[data['Glucose'].mean()])
data['BloodPressure']=data['BloodPressure'].replace([0],
[data['BloodPressure'].mean()])
data['SkinThickness']=data['SkinThickness'].replace([0],
[data['SkinThickness'].mean()])
data['Insulin']=data['Insulin'].replace([0],[data['Insulin'].mean()])
data['Pregnancies']=data['Pregnancies'].replace([0],[data['Pregnancies'].mean()])
data['BMI']=data['BMI'].replace([0],[data['BMI'].mean()])

data.describe()

#Checking the null value percentage of the treated columns

null_percentage_treated = (data[selected_columns] == 0).mean() * 100

# Displaying the null value percentage for each selected column

print("Percentage of Null Values for Each Column after the null value treatment:")
print(null_percentage_treated)

columns=data[selected_columns]

# Display boxplots for numeric columns to visualize outliers

plt.figure(figsize=(12, 8))
sns.boxplot(data=columns)
plt.title("Boxplots for Numeric Columns")
plt.show()

# Finding the Outlier Count in the selected Columns:

def find_outliers_iqr(data, column_name):
# Calculate the first quartile (Q1) and third quartile (Q3)
Q1 = data[column_name].quantile(0.25)
Q3 = data[column_name].quantile(0.75)

# Calculate the interquartile range (IQR)

IQR = Q3 - Q1

# Define the lower and upper bounds for outliers

lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

# Find outliers
outliers = data[(data[column_name] < lower_bound) | (data[column_name] >
upper_bound)]

# Count the number of outliers

count_outliers = len(outliers)

return count_outliers

# Calculate and print the number of outliers for each column of interest
for column_name in selected_columns:
outlier_count = find_outliers_iqr(data, column_name)
print(f"Number of outliers in the '{column_name}' column: {outlier_count}")

Heart Disease Diagnosis Using Machine Learning
No ratings yet
Heart Disease Diagnosis Using Machine Learning
26 pages
Patient Data Management System
100% (1)
Patient Data Management System
27 pages
Health Risk Prediction
No ratings yet
Health Risk Prediction
80 pages
ML LAB Manual-1
No ratings yet
ML LAB Manual-1
33 pages
ML Ex2
No ratings yet
ML Ex2
7 pages
ML 8 Program
No ratings yet
ML 8 Program
5 pages
DSBDA2
No ratings yet
DSBDA2
6 pages
Cardiovascular Disease Prediction
No ratings yet
Cardiovascular Disease Prediction
2 pages
ML Lab Manual Experiments 1 To 5 Easy
No ratings yet
ML Lab Manual Experiments 1 To 5 Easy
3 pages
DSDBAAssignment2 SUMEET
No ratings yet
DSDBAAssignment2 SUMEET
8 pages
DA Programs
No ratings yet
DA Programs
44 pages
Da Rec
No ratings yet
Da Rec
29 pages
Practicle6 (Code)
No ratings yet
Practicle6 (Code)
4 pages
ML Manual Final
No ratings yet
ML Manual Final
35 pages
Data Warehousing and Data Mining
No ratings yet
Data Warehousing and Data Mining
24 pages
Healthcare-Project-Simplilearn - Week3
No ratings yet
Healthcare-Project-Simplilearn - Week3
7 pages
Stroke Prediction
No ratings yet
Stroke Prediction
10 pages
ML 7
No ratings yet
ML 7
6 pages
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
No ratings yet
Lab Manual - MachineLearningLaboratory-DR - Vaishnavi
71 pages
COMP5318
No ratings yet
COMP5318
42 pages
Data Preprocessing Techniques in Python
No ratings yet
Data Preprocessing Techniques in Python
27 pages
HIV Regression Source Code
No ratings yet
HIV Regression Source Code
26 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
Diabetes Prediction with KNN Model
No ratings yet
Diabetes Prediction with KNN Model
12 pages
Linear and Multilinear Regression
No ratings yet
Linear and Multilinear Regression
5 pages
Code and Outputs
No ratings yet
Code and Outputs
25 pages
Linear Reg Signal and Noise PDF
No ratings yet
Linear Reg Signal and Noise PDF
20 pages
Data Mining Lab: Regression & Clustering
No ratings yet
Data Mining Lab: Regression & Clustering
36 pages
Model2.ipynb - Colab
No ratings yet
Model2.ipynb - Colab
11 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
5 pages
Abdimas Hki3f52b4c6
No ratings yet
Abdimas Hki3f52b4c6
6 pages
1
No ratings yet
1
13 pages
Group Work Assignment Supervised and Unsupervised Learning
No ratings yet
Group Work Assignment Supervised and Unsupervised Learning
10 pages
DS Problem Statements and Codes
No ratings yet
DS Problem Statements and Codes
21 pages
Final-12-Lab Programs
No ratings yet
Final-12-Lab Programs
30 pages
Data Preprocessing in Python Guide
No ratings yet
Data Preprocessing in Python Guide
22 pages
KNN For Classification
No ratings yet
KNN For Classification
5 pages
Data - Analytics Lab - Manual JNTUH R22 Regulation
No ratings yet
Data - Analytics Lab - Manual JNTUH R22 Regulation
26 pages
Lab2 Day8 23BCSA84 AssignmentSolution
No ratings yet
Lab2 Day8 23BCSA84 AssignmentSolution
7 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
Python 1
No ratings yet
Python 1
3 pages
DA Lab
No ratings yet
DA Lab
27 pages
Data Perparation Penting
No ratings yet
Data Perparation Penting
12 pages
ML
No ratings yet
ML
17 pages
ML Lab Programs PDF
No ratings yet
ML Lab Programs PDF
15 pages
Practical 4
No ratings yet
Practical 4
2 pages
Exp 2
No ratings yet
Exp 2
6 pages
DataAnalytics Lab Manual
No ratings yet
DataAnalytics Lab Manual
35 pages
1st PGM
No ratings yet
1st PGM
10 pages
DV Mid Internal 1
No ratings yet
DV Mid Internal 1
8 pages
Aiml Programs
No ratings yet
Aiml Programs
12 pages
ML Complete Notes Hridoy
No ratings yet
ML Complete Notes Hridoy
5 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Step 1
No ratings yet
Step 1
10 pages
1 2 3 4 6 7 8 9 10 Merged
No ratings yet
1 2 3 4 6 7 8 9 10 Merged
21 pages
ML Lab Codes
No ratings yet
ML Lab Codes
14 pages
Anpadh Neta
No ratings yet
Anpadh Neta
5 pages
Diet Nutrition Book
No ratings yet
Diet Nutrition Book
236 pages
AAiT 2016 Y I S II 20 Sections April 2024
No ratings yet
AAiT 2016 Y I S II 20 Sections April 2024
20 pages
Circle Voice 43-2 PDF
No ratings yet
Circle Voice 43-2 PDF
11 pages
Term Loan Disbural Details For The Year 2018-19-1574933960
No ratings yet
Term Loan Disbural Details For The Year 2018-19-1574933960
29 pages
Freedom of Information (FOI) Pinagtatagal para Hindi Sila Tamaan?
No ratings yet
Freedom of Information (FOI) Pinagtatagal para Hindi Sila Tamaan?
1 page
30x113mm HEDP 1
No ratings yet
30x113mm HEDP 1
2 pages
Area Calculation in 4th Grade Math
No ratings yet
Area Calculation in 4th Grade Math
6 pages
David Woodward, J. B. Harley - The History of Cartography, Volume 2, Book 2 - Cartography in The Traditional East and Southeast Asian Societies-University of Chicago Press (1995)
100% (4)
David Woodward, J. B. Harley - The History of Cartography, Volume 2, Book 2 - Cartography in The Traditional East and Southeast Asian Societies-University of Chicago Press (1995)
962 pages
Thesis Statement Guide for WWI & WWII
100% (3)
Thesis Statement Guide for WWI & WWII
6 pages
Criteria For Website
No ratings yet
Criteria For Website
2 pages
Startup List
50% (2)
Startup List
64 pages
ZoomCar Case Overview
No ratings yet
ZoomCar Case Overview
112 pages
Quiz Bowl
100% (1)
Quiz Bowl
11 pages
Nina Sibal - Wikipedia
No ratings yet
Nina Sibal - Wikipedia
11 pages
SNHU 107 Module Six Journal
No ratings yet
SNHU 107 Module Six Journal
2 pages
Girls Sex Video 09
No ratings yet
Girls Sex Video 09
4 pages
Soal Ulangan
0% (1)
Soal Ulangan
4 pages
Islamic Perspectives on Love and Marriage
100% (1)
Islamic Perspectives on Love and Marriage
62 pages
DLP 07-03-25 Gen.p
No ratings yet
DLP 07-03-25 Gen.p
5 pages
Vocabulary Units Real World Advanced 2 Eso
No ratings yet
Vocabulary Units Real World Advanced 2 Eso
9 pages
DSC++ Unit III
No ratings yet
DSC++ Unit III
35 pages
Sales & Distribution Blueprint
100% (4)
Sales & Distribution Blueprint
29 pages
Laws of Radicals: Product & Quotient Rules
No ratings yet
Laws of Radicals: Product & Quotient Rules
11 pages
Green Papaya Salad Recipe (Som Tum) Temple of Thai
100% (1)
Green Papaya Salad Recipe (Som Tum) Temple of Thai
2 pages
Office Memorandom 4517
No ratings yet
Office Memorandom 4517
1 page
Engine Data Sheet For KFP4R-UF16R2
100% (2)
Engine Data Sheet For KFP4R-UF16R2
3 pages
CBL #2
No ratings yet
CBL #2
2 pages
Fundamentals of Fibre Reinforced Composite Materials, 2nd Edition A. R. Bunsell - The Ebook Is Ready For Instant Download and Access
100% (4)
Fundamentals of Fibre Reinforced Composite Materials, 2nd Edition A. R. Bunsell - The Ebook Is Ready For Instant Download and Access
76 pages

Week1 Code Corrected

Uploaded by

Week1 Code Corrected

Uploaded by

import numpy as np

data=pd.read_excel('health care diabetes.xlsx')

#Identifying the mean of the features

# Finding the number of rows which has the null values

# Finding the null value percentage

# Displaying the null value percentage for each selected column

# Replacing the null values with the mean

#Checking the null value percentage of the treated columns

# Displaying the null value percentage for each selected column

# Display boxplots for numeric columns to visualize outliers

# Finding the Outlier Count in the selected Columns:

# Calculate the interquartile range (IQR)

# Define the lower and upper bounds for outliers

# Count the number of outliers

You might also like