0% found this document useful (0 votes)

21 views3 pages

Python Data Analysis for ML

Uploaded by

Rizal Rafi Nugraha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views3 pages

Python Data Analysis for ML

Uploaded by

Rizal Rafi Nugraha

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

6/8/24, 6:29 PM Machine Learning.

ipynb - Colab

Tugas Phyton for Data Analisis (Machine Learning) - Ali Al Faruq Rahmatillah - 9882405221121004

from google.colab import drive

drive.mount('/content/drive')

Mounted at /content/drive

import pandas as pd

# Path file di Google Drive

file_path = '/content/drive/MyDrive/bank-train.csv'

# Membaca file CSV

data = pd.read_csv(file_path)

# Menampilkan beberapa baris awal dataset

print(data.head())

id age job marital education default housing loan \

0 12556 40 blue-collar married basic.9y unknown yes no
1 35451 31 admin. married university.degree no no no
2 30592 59 retired married basic.4y no no no
3 17914 43 housemaid divorced basic.9y no yes no
4 3315 39 admin. single high.school unknown no no

contact month ... campaign pdays previous poutcome emp.var.rate \

0 telephone jul ... 2 999 0 nonexistent 1.4
1 cellular may ... 4 999 0 nonexistent -1.8
2 cellular may ... 6 999 1 failure -1.8
3 cellular jul ... 5 999 0 nonexistent 1.4
4 telephone may ... 2 999 0 nonexistent 1.1

cons.price.idx cons.conf.idx euribor3m nr.employed y

0 93.918 -42.7 4.960 5228.1 0
1 92.893 -46.2 1.244 5099.1 0
2 92.893 -46.2 1.354 5099.1 0
3 93.918 -42.7 4.961 5228.1 0
4 93.994 -36.4 4.860 5191.0 0

[5 rows x 22 columns]

import pandas as pd

# Memuat dataset
data = pd.read_csv('/content/drive/MyDrive/bank-train.csv')

# Menampilkan beberapa baris awal dataset

print(data.head())

id age job marital education default housing loan \

contact month ... campaign pdays previous poutcome emp.var.rate \

cons.price.idx cons.conf.idx euribor3m nr.employed y

0 93.918 -42.7 4.960 5228.1 0
1 92.893 -46.2 1.244 5099.1 0
2 92.893 -46.2 1.354 5099.1 0
3 93.918 -42.7 4.961 5228.1 0
4 93.994 -36.4 4.860 5191.0 0

[5 rows x 22 columns]

https://colab.research.google.com/drive/1ARNPIwE6NvW8hE9pAYsqahZnDOp-5zH_#scrollTo=rf5ikIApm5xG&printMode=true 1/3
6/8/24, 6:29 PM Machine Learning.ipynb - Colab
from sklearn.preprocessing import LabelEncoder, StandardScaler

# Menghilangkan baris dengan nilai yang hilang

data = data.dropna()

# Meng-encode variabel kategorikal

label_encoders = {}
categorical_columns = data.select_dtypes(include=['object']).columns
for column in categorical_columns:
le = LabelEncoder()
data[column] = le.fit_transform(data[column])
label_encoders[column] = le

# Memisahkan fitur dan target

X = data.drop('y', axis=1)
y = data['y']

# Normalisasi fitur
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

from sklearn.ensemble import RandomForestClassifier

# Membuat dan melatih model Random Forest

model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

▾ RandomForestClassifier
RandomForestClassifier(random_state=42)

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

# Prediksi pada set pengujian

y_pred = model.predict(X_test)

# Evaluasi model
conf_matrix = confusion_matrix(y_test, y_pred)
class_report = classification_report(y_test, y_pred)
accuracy = accuracy_score(y_test, y_pred)

conf_matrix, class_report, accuracy

(array([[5641, 207],
[ 360, 382]]),
' precision recall f1-score support\n\n 0 0.94 0.96 0.95 5848\n 1
0.65 0.51 0.57 742\n\n accuracy 0.91 6590\n macro avg 0.79 0.74
0.76 6590\nweighted avg 0.91 0.91 0.91 6590\n',
0.9139605462822459)

import matplotlib.pyplot as plt

import seaborn as sns
from sklearn.metrics import confusion_matrix, classification_report, accuracy_score

# Prediksi pada set pengujian

y_pred = model.predict(X_test)

# Menghitung confusion matrix

conf_matrix = confusion_matrix(y_test, y_pred)

# Menampilkan confusion matrix dalam bentuk visual

plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues', xticklabels=['Predicted No', 'Predicted Yes'], yticklabels=['Actual No', 'Actual
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.title('Confusion Matrix')
plt.show()

# Menampilkan classification report dan accuracy score

class_report = classification_report(y_test, y_pred)
accuracy = accuracy_score(y_test, y_pred)
i t("Cl ifi ti R t \ " l t)
https://colab.research.google.com/drive/1ARNPIwE6NvW8hE9pAYsqahZnDOp-5zH_#scrollTo=rf5ikIApm5xG&printMode=true 2/3
6/8/24, 6:29 PM Machine Learning.ipynb - Colab
print("Classification Report:\n", class_report)
print("Accuracy Score:", accuracy)

Classification Report:
precision recall f1-score support

0 0.94 0.96 0.95 5848

1 0.65 0.51 0.57 742

accuracy 0.91 6590

macro avg 0.79 0.74 0.76 6590
weighted avg 0.91 0.91 0.91 6590

Accuracy Score: 0.9139605462822459

print("Terima kasih!")

Terima kasih!

https://colab.research.google.com/drive/1ARNPIwE6NvW8hE9pAYsqahZnDOp-5zH_#scrollTo=rf5ikIApm5xG&printMode=true 3/3

Asg One
No ratings yet
Asg One
10 pages
Building Logistic Regression Model in Python
No ratings yet
Building Logistic Regression Model in Python
24 pages
Bank Marketing Classification Models
No ratings yet
Bank Marketing Classification Models
23 pages
Pract5 1
No ratings yet
Pract5 1
3 pages
Data Pre Processing and Cleaning
No ratings yet
Data Pre Processing and Cleaning
56 pages
57 - AI2 - PRAC 6.ipynb - Colab
No ratings yet
57 - AI2 - PRAC 6.ipynb - Colab
3 pages
Hands-On Activity 3.3 Random Forest Mantaring - Ipynb - Mantaring
No ratings yet
Hands-On Activity 3.3 Random Forest Mantaring - Ipynb - Mantaring
13 pages
DS Capestone PDF
No ratings yet
DS Capestone PDF
41 pages
Germany Credit Analysis
No ratings yet
Germany Credit Analysis
41 pages
Data Pre Processing and Cleaning
No ratings yet
Data Pre Processing and Cleaning
23 pages
K-Means Clustering Analysis
No ratings yet
K-Means Clustering Analysis
3 pages
BankX Marketing 1744722258
No ratings yet
BankX Marketing 1744722258
29 pages
Animesh Jain
No ratings yet
Animesh Jain
13 pages
All Life Bank - AIML - ML - Project - Low - Code - Notebook
No ratings yet
All Life Bank - AIML - ML - Project - Low - Code - Notebook
78 pages
Quadexp IDS Project
No ratings yet
Quadexp IDS Project
22 pages
Exp 343
No ratings yet
Exp 343
18 pages
Loan Prediction
No ratings yet
Loan Prediction
33 pages
Articles Xgboost Classification With Smote-Enn Algorithm
No ratings yet
Articles Xgboost Classification With Smote-Enn Algorithm
11 pages
Data Analysis in The Banking Sector: Pandas Fundamentals
No ratings yet
Data Analysis in The Banking Sector: Pandas Fundamentals
16 pages
Zindi Financial Inclusion Guide
No ratings yet
Zindi Financial Inclusion Guide
12 pages
Imbalanced Dataset Customer Churn
No ratings yet
Imbalanced Dataset Customer Churn
9 pages
PA v0.21
No ratings yet
PA v0.21
17 pages
2IA02 Fauzan Ramadhan
No ratings yet
2IA02 Fauzan Ramadhan
10 pages
LendingClub Loan Default Prediction Model
No ratings yet
LendingClub Loan Default Prediction Model
18 pages
Jupyter Notebook Project CART RF ANN
100% (1)
Jupyter Notebook Project CART RF ANN
41 pages
SMARAN HR Analytics - Ipynb - Colab
No ratings yet
SMARAN HR Analytics - Ipynb - Colab
65 pages
Neural Network
No ratings yet
Neural Network
7 pages
Machine Learning Using Python Question Paper 1
No ratings yet
Machine Learning Using Python Question Paper 1
4 pages
Unit7 Working With Pandas - Solved
No ratings yet
Unit7 Working With Pandas - Solved
12 pages
Dsbda 5
No ratings yet
Dsbda 5
4 pages
KNN Practical Debasmita Datta
No ratings yet
KNN Practical Debasmita Datta
6 pages
Telco Customer Churn Prediction Dataset
No ratings yet
Telco Customer Churn Prediction Dataset
16 pages
Ai Labtask13
No ratings yet
Ai Labtask13
3 pages
Data Preprocessing 1
No ratings yet
Data Preprocessing 1
6 pages
Bank Customer Churn Analysis - Jupyter Notebook
No ratings yet
Bank Customer Churn Analysis - Jupyter Notebook
11 pages
MSML Project 1
No ratings yet
MSML Project 1
8 pages
Census Income Data Analysis Guide
No ratings yet
Census Income Data Analysis Guide
22 pages
Bank Rpubs
No ratings yet
Bank Rpubs
24 pages
Data Analytics for Actuaries
No ratings yet
Data Analytics for Actuaries
76 pages
Cars Project PDF
No ratings yet
Cars Project PDF
9 pages
Datascience PR 6 Veda
No ratings yet
Datascience PR 6 Veda
6 pages
Practice Test
No ratings yet
Practice Test
12 pages
Supervised Decision Trees A Case Study For AllLife Bank
No ratings yet
Supervised Decision Trees A Case Study For AllLife Bank
50 pages
1 - Understanding - The - Problem - and - The - Data - Ipynb - Colaboratory
No ratings yet
1 - Understanding - The - Problem - and - The - Data - Ipynb - Colaboratory
9 pages
Modelling and Simmulation Assignment - Ipynb - Colab
No ratings yet
Modelling and Simmulation Assignment - Ipynb - Colab
7 pages
Loan Approval Prediction Python
No ratings yet
Loan Approval Prediction Python
6 pages
Bank Marketing Ingles
No ratings yet
Bank Marketing Ingles
37 pages
LDA CreditCardDefault Code N
No ratings yet
LDA CreditCardDefault Code N
11 pages
Random Forest
No ratings yet
Random Forest
8 pages
Bank Marketing ML Project
No ratings yet
Bank Marketing ML Project
5 pages
Bank Marketing Data Analysis
No ratings yet
Bank Marketing Data Analysis
18 pages
Data Preprocessing for Auto Insurance
No ratings yet
Data Preprocessing for Auto Insurance
22 pages
Cleaning Data in Python
No ratings yet
Cleaning Data in Python
8 pages
Customer Churn Model Analysis
No ratings yet
Customer Churn Model Analysis
2 pages
Kunal Assignment 3
No ratings yet
Kunal Assignment 3
19 pages
A09Ass05 - Jupyter Notebook
No ratings yet
A09Ass05 - Jupyter Notebook
15 pages
Insurance - CART - RF - ANN - Models - Kaggle
No ratings yet
Insurance - CART - RF - ANN - Models - Kaggle
81 pages
Classification
No ratings yet
Classification
3 pages
Architecture Thesis: Public Baths
No ratings yet
Architecture Thesis: Public Baths
42 pages
Analysis of Social Media Texting in English
No ratings yet
Analysis of Social Media Texting in English
9 pages
Tropentag 2012: International Research On Food Security, Natural Resource Management and Rural Development Held at Georg-August-Universität Göttingen (Germany) On 19-21 September, 2012.
No ratings yet
Tropentag 2012: International Research On Food Security, Natural Resource Management and Rural Development Held at Georg-August-Universität Göttingen (Germany) On 19-21 September, 2012.
588 pages
Causes of Construction Delays in DPWH
No ratings yet
Causes of Construction Delays in DPWH
2 pages
2017-18 M.B.A PDF
No ratings yet
2017-18 M.B.A PDF
167 pages
Coffee Farmers Project
No ratings yet
Coffee Farmers Project
38 pages
Reductionism vs Holism in Memory Research
No ratings yet
Reductionism vs Holism in Memory Research
23 pages
Leadership Behaviors, Attitudes, and Styles: Week 8-9
No ratings yet
Leadership Behaviors, Attitudes, and Styles: Week 8-9
26 pages
Iris Dataset Linear Regression Guide
No ratings yet
Iris Dataset Linear Regression Guide
4 pages
ANCAMTA Experts of Engineering, Management Consulting and Capacity Building
No ratings yet
ANCAMTA Experts of Engineering, Management Consulting and Capacity Building
49 pages
Engineering Admission Ranks
No ratings yet
Engineering Admission Ranks
9 pages
Total Knee Replacement Wear During
No ratings yet
Total Knee Replacement Wear During
8 pages
302-Article Text-775-1-10-20181222 PDF
No ratings yet
302-Article Text-775-1-10-20181222 PDF
13 pages
Grade 9 Reading Rubric
100% (2)
Grade 9 Reading Rubric
3 pages
RANZCOG Annual Report 2013
No ratings yet
RANZCOG Annual Report 2013
43 pages
FDA Data Integrity Expectations
100% (3)
FDA Data Integrity Expectations
38 pages
Pre-Sales Market Strategist Profile
No ratings yet
Pre-Sales Market Strategist Profile
2 pages
Analyzing the 1947 India-Pakistan Partition
No ratings yet
Analyzing the 1947 India-Pakistan Partition
16 pages
MA-MBA Project Paper Guidebook
100% (1)
MA-MBA Project Paper Guidebook
39 pages
Design and Evaluation of Bell-Shaped Lift Distribution For A Flying Wing Configuration
100% (2)
Design and Evaluation of Bell-Shaped Lift Distribution For A Flying Wing Configuration
77 pages
SPSS 17 Guide: Data Analysis Basics
100% (4)
SPSS 17 Guide: Data Analysis Basics
77 pages
Audit Planning and Materi-Ality
No ratings yet
Audit Planning and Materi-Ality
47 pages
CIOMS WG XII Benefit Risk Presentation Final PolishedVisual
No ratings yet
CIOMS WG XII Benefit Risk Presentation Final PolishedVisual
27 pages
Scope and Limitation of The Study
64% (11)
Scope and Limitation of The Study
28 pages
Brouthers Et Al 2022
No ratings yet
Brouthers Et Al 2022
28 pages
CUSUM Chart for Process Monitoring
No ratings yet
CUSUM Chart for Process Monitoring
6 pages
Higher Secondary Statistics Sample Questions
No ratings yet
Higher Secondary Statistics Sample Questions
11 pages
Action Research Proposal 2.0
No ratings yet
Action Research Proposal 2.0
4 pages
Ravens Adaptive Manual
No ratings yet
Ravens Adaptive Manual
38 pages
Guidelines Research Center
No ratings yet
Guidelines Research Center
4 pages

Python Data Analysis for ML

Uploaded by

Python Data Analysis for ML

Uploaded by

6/8/24, 6:29 PM Machine Learning.

from google.colab import drive

# Path file di Google Drive

# Membaca file CSV

# Menampilkan beberapa baris awal dataset

id age job marital education default housing loan \

contact month ... campaign pdays previous poutcome emp.var.rate \

cons.price.idx cons.conf.idx euribor3m nr.employed y

# Menampilkan beberapa baris awal dataset

id age job marital education default housing loan \

contact month ... campaign pdays previous poutcome emp.var.rate \

cons.price.idx cons.conf.idx euribor3m nr.employed y

# Menghilangkan baris dengan nilai yang hilang

# Meng-encode variabel kategorikal

# Memisahkan fitur dan target

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

from sklearn.ensemble import RandomForestClassifier

# Membuat dan melatih model Random Forest

from sklearn.metrics import classification_report, confusion_matrix, accuracy_score

# Prediksi pada set pengujian

conf_matrix, class_report, accuracy

import matplotlib.pyplot as plt

# Prediksi pada set pengujian

# Menghitung confusion matrix

# Menampilkan confusion matrix dalam bentuk visual

# Menampilkan classification report dan accuracy score

0 0.94 0.96 0.95 5848

accuracy 0.91 6590

Accuracy Score: 0.9139605462822459

You might also like