0% found this document useful (0 votes)

21 views4 pages

Import Numpy As NP

The document outlines a data analysis process using Python libraries such as pandas, matplotlib, and scikit-learn. It involves loading training and testing datasets, performing exploratory data analysis, visualizing data distributions, and building a Random Forest classifier to predict outcomes based on features. The model's accuracy is calculated, and feature importance is assessed to understand the contribution of each feature to the predictions.

Uploaded by

pkpkpavan2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views4 pages

Import Numpy As NP

Uploaded by

pkpkpavan2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

import numpy as np # linear algebra

import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

import matpoltlib.pyplot as plt

import os

import numpy as np

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

from sklearn.svm import SVR

from matplotlib.colors import ListedColormap

test=pd.read_csv("Testing.csv")

train=pd.read_csv("Training.csv")

train.sample(n=1)

#This will indicate any random 1 data will be retreived

data = pd.concat([train, test])

data.sample(10)

#This will give us randome sample data

data.head(5)
# This will retrieve the 1st 5 data

data.tail(5)

# This will retrive the last 5 data

data.columns

# This will retrieve all the colums associated with the dataset

data.shape

# It has 4961 rows and 133 columns

data.info()

# What we are expecting from visualization. ?

data.boxplot(column ='skin_rash', by='itching') #boxplot shows outlier, median,Q3,Q1

# # What we are expecting from visualization. ?

data1 =data.loc[:,["itching","skin_rash","coma"] ]

data1.plot()

## What we are expecting from visualization. ?

data1.plot(subplots =True)

data.plot(kind= "scatter",x="depression", y="muscle_pain")

data.plot(kind="hist", y="acidity", bins = 50, range=(0,250))

data.isnull().sum()

#Importing the train_test_split functionality

from sklearn.model_selection import train_test_split

X, y=data.iloc[:,:-1], data.iloc[:,-1]

#Spliting the dataset into training set and test set

X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.3)

#70% training and 30% test

#Import Random Forest Model

from sklearn.ensemble import RandomForestClassifier

#Create a Gaussian Classifier

clf=RandomForestClassifier(n_estimators=100)

#Train the model using the training sets y_pred=clf.predict(X_test)

clf.fit(X_train,y_train)

y_pred=clf.predict(X_test)

#Import scikit-learn metrics module for accuracy calculation

from sklearn import metrics

# Model Accuracy, how often is the classifier correct?

print("Accuracy:",metrics.accuracy_score(y_test, y_pred))

feature_imp = pd.Series(clf.feature_importances_,index=list(data.columns[:-
1])).sort_values(ascending=False).head(50)

feature_imp[::-1]

feature_imp2 =
pd.Series(clf2.feature_importances_,index=list(X_reduced.columns)).sort_values(asce
nding=False)

feature_imp2[::-1]

#looking how much percent each diseases having

data['prognosis'].value_counts(normalize = True)

Disease Prediction2 Printout
No ratings yet
Disease Prediction2 Printout
5 pages
1
No ratings yet
1
13 pages
ML Lab
No ratings yet
ML Lab
10 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
ML Batch
No ratings yet
ML Batch
36 pages
AML Lab
No ratings yet
AML Lab
14 pages
Experiment 1
No ratings yet
Experiment 1
19 pages
ML Regression & Classification Guide
100% (1)
ML Regression & Classification Guide
45 pages
AI ML - Cycle 2 Programs
No ratings yet
AI ML - Cycle 2 Programs
15 pages
Medical Data ML
No ratings yet
Medical Data ML
6 pages
SVM K NN MLP With Sklearn Jupyter NoteBo
No ratings yet
SVM K NN MLP With Sklearn Jupyter NoteBo
22 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
Experiment 4
No ratings yet
Experiment 4
3 pages
Aiml 5-8
No ratings yet
Aiml 5-8
19 pages
ML
No ratings yet
ML
11 pages
ML 1
No ratings yet
ML 1
11 pages
Nitin ML Assignment 1
No ratings yet
Nitin ML Assignment 1
18 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
Disease Prediction with Machine Learning
No ratings yet
Disease Prediction with Machine Learning
573 pages
Support Vector Machine For Classification: Name: Saurav Doke Roll No: A-41 PRN: 2264191242040
No ratings yet
Support Vector Machine For Classification: Name: Saurav Doke Roll No: A-41 PRN: 2264191242040
3 pages
PYHTONPRACT
No ratings yet
PYHTONPRACT
4 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Week 7 Laboratory Activity
No ratings yet
Week 7 Laboratory Activity
12 pages
Code Shabab Error 7
No ratings yet
Code Shabab Error 7
5 pages
Titanic Data Analysis with Python
No ratings yet
Titanic Data Analysis with Python
20 pages
MLL
No ratings yet
MLL
2 pages
SVM Implementation
No ratings yet
SVM Implementation
8 pages
ML Programs
No ratings yet
ML Programs
14 pages
DSBDA Prac4 2
No ratings yet
DSBDA Prac4 2
1 page
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
Decision Tree
No ratings yet
Decision Tree
2 pages
PyTorch Tabular Regression Guide
No ratings yet
PyTorch Tabular Regression Guide
13 pages
B24 ML Exp-3
No ratings yet
B24 ML Exp-3
10 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
AIML Lab 7 8 9 10
No ratings yet
AIML Lab 7 8 9 10
10 pages
Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
ML Lab 01999676272
No ratings yet
ML Lab 01999676272
12 pages
ML 4 SVM
No ratings yet
ML 4 SVM
3 pages
Linear SVM: 'Target'
No ratings yet
Linear SVM: 'Target'
13 pages
ML Experiment WithDataset
No ratings yet
ML Experiment WithDataset
23 pages
ML II Lab
No ratings yet
ML II Lab
5 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Code and Output of Cancer Detection Model
No ratings yet
Code and Output of Cancer Detection Model
13 pages
ML
No ratings yet
ML
5 pages
Ex 6, EX 7 AIML
No ratings yet
Ex 6, EX 7 AIML
9 pages
ML Lab Experiment Shortened With Same Output
No ratings yet
ML Lab Experiment Shortened With Same Output
6 pages
Data Science with Max: SVM & PCA Guide
No ratings yet
Data Science with Max: SVM & PCA Guide
7 pages
All in One
No ratings yet
All in One
13 pages
ML PDF
No ratings yet
ML PDF
30 pages
AML Code For m2
No ratings yet
AML Code For m2
7 pages
ML Complete Notes Hridoy
No ratings yet
ML Complete Notes Hridoy
5 pages
ML Remaining Jds
No ratings yet
ML Remaining Jds
35 pages
Svmdoc
No ratings yet
Svmdoc
7 pages
Car Evaluation Data Analysis & Random Forest Model
No ratings yet
Car Evaluation Data Analysis & Random Forest Model
12 pages

Import Numpy As NP

Uploaded by

Import Numpy As NP

Uploaded by

import numpy as np # linear algebra

import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

import matpoltlib.pyplot as plt

import seaborn as sns

import matplotlib.pyplot as plt

from sklearn.svm import SVR

from matplotlib.colors import ListedColormap

#This will indicate any random 1 data will be retreived

data = pd.concat([train, test])

#This will give us randome sample data

# This will retrive the last 5 data

# It has 4961 rows and 133 columns

# What we are expecting from visualization. ?

data.boxplot(column ='skin_rash', by='itching') #boxplot shows outlier, median,Q3,Q1

# # What we are expecting from visualization. ?

## What we are expecting from visualization. ?

data.plot(kind= "scatter",x="depression", y="muscle_pain")

data.plot(kind="hist", y="acidity", bins = 50, range=(0,250))

#Importing the train_test_split functionality

#Spliting the dataset into training set and test set

X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.3)

#70% training and 30% test

#Import Random Forest Model

from sklearn.ensemble import RandomForestClassifier

#Create a Gaussian Classifier

#Train the model using the training sets y_pred=clf.predict(X_test)

#Import scikit-learn metrics module for accuracy calculation

from sklearn import metrics

# Model Accuracy, how often is the classifier correct?

#looking how much percent each diseases having

You might also like