0% found this document useful (0 votes)

8 views2 pages

Practical1c.ipynb - Colab

The document outlines a data processing workflow using Python libraries, including pandas and scikit-learn, to manipulate a sample dataset with categorical and numerical variables. It demonstrates label encoding, min-max scaling, standard scaling, and binarization of the data. Finally, the processed dataset is saved as a CSV file named 'processed_data.csv'.

Uploaded by

Tania Jamdar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views2 pages

Practical1c.ipynb - Colab

Uploaded by

Tania Jamdar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

11/30/24, 3:34 PM Practical1c.

ipynb - Colab

# Import required libraries

import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder, MinMaxScaler, StandardScaler, Binarizer

# Create a sample dataset

data = pd.DataFrame({
'Category': ['A', 'B', 'C', 'A', 'B', 'C'], # Categorical variable
'Age': [23, 45, 31, 22, 35, 30], # Numerical variable
'Income': [50000, 60000, 70000, 80000, 90000, 100000], # Numerical variable
'Has_Car': ['Yes', 'No', 'Yes', 'No', 'Yes', 'No'] # Binary categorical variable
})
# Display the dataset
print("Sample Dataset:")
print(data)

Sample Dataset:
Category Age Income Has_Car
0 A 23 50000 Yes
1 B 45 60000 No
2 C 31 70000 Yes
3 A 22 80000 No
4 B 35 90000 Yes
5 C 30 100000 No

# Label Encoding for 'Category' column

label_encoder = LabelEncoder()
data['Category_Encoded'] = label_encoder.fit_transform(data['Category'])
# Label Encoding for binary column 'Has_Car'
data['Has_Car_Encoded'] = label_encoder.fit_transform(data['Has_Car'])
print("\nAfter Label Encoding:")
print(data)

After Label Encoding:

Category Age Income Has_Car Category_Encoded Has_Car_Encoded
0 A 23 50000 Yes 0 1
1 B 45 60000 No 1 0
2 C 31 70000 Yes 2 1
3 A 22 80000 No 0 0
4 B 35 90000 Yes 1 1
5 C 30 100000 No 2 0

# Min-Max Scaling for 'Income'

min_max_scaler = MinMaxScaler()
data['Income_MinMax'] = min_max_scaler.fit_transform(data[['Income']])
# Standard Scaling for 'Age'
standard_scaler = StandardScaler()
data['Age_Standardized'] = standard_scaler.fit_transform(data[['Age']])
print("\nAfter Scaling:")
print(data)

After Scaling:
Category Age Income Has_Car Category_Encoded Has_Car_Encoded \
0 A 23 50000 Yes 0 1
1 B 45 60000 No 1 0
2 C 31 70000 Yes 2 1
3 A 22 80000 No 0 0
4 B 35 90000 Yes 1 1
5 C 30 100000 No 2 0

Income_MinMax Age_Standardized
0 0.0 -1.035676
1 0.2 1.812434
2 0.4 0.000000
3 0.6 -1.165136
4 0.8 0.517838
5 1.0 -0.129460

# Binarization for 'Income' with a threshold of 75,000

binarizer = Binarizer(threshold=75000)
data['Income_Binary'] = binarizer.fit_transform(data[['Income']])
print("\nAfter Binarization:")
print(data)

After Binarization:
Category Age Income Has_Car Category_Encoded Has_Car_Encoded \
0 A 23 50000 Yes 0 1
1 B 45 60000 No 1 0

https://colab.research.google.com/drive/1vzCv7xFKj-Mru4D-MXvHU496haU-bL0I#scrollTo=8V8mxZ5Uhops&printMode=true 1/2
11/30/24, 3:34 PM Practical1c.ipynb - Colab
2 C 31 70000 Yes 2 1
3 A 22 80000 No 0 0
4 B 35 90000 Yes 1 1
5 C 30 100000 No 2 0

Income_MinMax Age_Standardized Income_Binary

0 0.0 -1.035676 0
1 0.2 1.812434 0
2 0.4 0.000000 0
3 0.6 -1.165136 1
4 0.8 0.517838 1
5 1.0 -0.129460 1

# Save the processed dataset

data.to_csv('processed_data.csv', index=False)
print("\nProcessed dataset saved as 'processed_data.csv'")

Processed dataset saved as 'processed_data.csv'

https://colab.research.google.com/drive/1vzCv7xFKj-Mru4D-MXvHU496haU-bL0I#scrollTo=8V8mxZ5Uhops&printMode=true 2/2

Credit Card Default Analysis
No ratings yet
Credit Card Default Analysis
5 pages
Assignment 1 DSB Da
No ratings yet
Assignment 1 DSB Da
14 pages
Week 10
No ratings yet
Week 10
50 pages
Data Preprocessing & Visualization1
No ratings yet
Data Preprocessing & Visualization1
2 pages
C++ and Python Data Analysis Programs
No ratings yet
C++ and Python Data Analysis Programs
30 pages
Lambda Functions & Alternative Methods in Python
No ratings yet
Lambda Functions & Alternative Methods in Python
8 pages
Aosdijfpqoiew
No ratings yet
Aosdijfpqoiew
6 pages
Project Paarth
No ratings yet
Project Paarth
21 pages
Unit-1 AI ML PYTHON - Jupyter Notebook
No ratings yet
Unit-1 AI ML PYTHON - Jupyter Notebook
10 pages
Abhiml ML File
No ratings yet
Abhiml ML File
74 pages
Machine Learning Record VR19
No ratings yet
Machine Learning Record VR19
46 pages
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
No ratings yet
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
12 pages
Ex 8
No ratings yet
Ex 8
3 pages
Data Science Exam Solutions
No ratings yet
Data Science Exam Solutions
1,326 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
7 pages
決策樹 R程式練習
No ratings yet
決策樹 R程式練習
11 pages
ML Lab - BCSL606
No ratings yet
ML Lab - BCSL606
67 pages
DAV Practicle File
No ratings yet
DAV Practicle File
28 pages
Panda Merged
No ratings yet
Panda Merged
19 pages
Germany Credit Analysis
No ratings yet
Germany Credit Analysis
41 pages
決策樹 R程式練習
No ratings yet
決策樹 R程式練習
11 pages
Machine Learning Program
No ratings yet
Machine Learning Program
12 pages
AIDS - DM Using Python - Lab Programs
No ratings yet
AIDS - DM Using Python - Lab Programs
19 pages
Abhi ML
No ratings yet
Abhi ML
11 pages
Matrix Operations and Data Analysis in Python
No ratings yet
Matrix Operations and Data Analysis in Python
38 pages
pt1 Answer Oops
No ratings yet
pt1 Answer Oops
8 pages
Openlab 1
No ratings yet
Openlab 1
17 pages
Data Science Practical Problems
No ratings yet
Data Science Practical Problems
40 pages
Assignment 1 Data Mining
No ratings yet
Assignment 1 Data Mining
1 page
ML LAB Manual-1
No ratings yet
ML LAB Manual-1
33 pages
Danmairo - Analysis - Ipynb - Colaboratory
No ratings yet
Danmairo - Analysis - Ipynb - Colaboratory
18 pages
Lab Programmes Adwaith
No ratings yet
Lab Programmes Adwaith
18 pages
Patel ML Lab 5
No ratings yet
Patel ML Lab 5
5 pages
Salary Estimation Using K-Nearest Neighbour
No ratings yet
Salary Estimation Using K-Nearest Neighbour
1 page
Data Preprocessing 1
No ratings yet
Data Preprocessing 1
6 pages
2022ucd2164 1 2
No ratings yet
2022ucd2164 1 2
35 pages
Data Analysis and NaN Handling Programs
No ratings yet
Data Analysis and NaN Handling Programs
38 pages
Assignmnet 5
No ratings yet
Assignmnet 5
11 pages
Python Data Science Exam Questions
No ratings yet
Python Data Science Exam Questions
8 pages
Ensemmmmm
No ratings yet
Ensemmmmm
10 pages
Naan Mudhalvan Assisgnment
No ratings yet
Naan Mudhalvan Assisgnment
6 pages
EDA - Exploratory Data Analysis
No ratings yet
EDA - Exploratory Data Analysis
16 pages
Assignment 03
No ratings yet
Assignment 03
6 pages
Mathallcodes 1
No ratings yet
Mathallcodes 1
32 pages
Week 01.a
No ratings yet
Week 01.a
4 pages
Note 4
No ratings yet
Note 4
18 pages
Edp 3
No ratings yet
Edp 3
16 pages
Linear Regression for Beginners
No ratings yet
Linear Regression for Beginners
6 pages
Data Analytics Lab Manual
No ratings yet
Data Analytics Lab Manual
26 pages
AML Project LearnerNotebook LowCode
No ratings yet
AML Project LearnerNotebook LowCode
74 pages
Census Income Data Analysis Guide
No ratings yet
Census Income Data Analysis Guide
22 pages
Machine Learning
No ratings yet
Machine Learning
81 pages
ML Cops
No ratings yet
ML Cops
17 pages
Alishba (S005)
No ratings yet
Alishba (S005)
5 pages
Mid-Sem Model Answer 7
No ratings yet
Mid-Sem Model Answer 7
5 pages
Practical 3
No ratings yet
Practical 3
8 pages
Pandas Questions Ip File
No ratings yet
Pandas Questions Ip File
13 pages
FYMCA IDSLab A6 Submission
No ratings yet
FYMCA IDSLab A6 Submission
9 pages
Predictive Modelling Alternate Project Business Case
No ratings yet
Predictive Modelling Alternate Project Business Case
47 pages
Joong (2021) Perception T and S Mexico Secondary Reform
No ratings yet
Joong (2021) Perception T and S Mexico Secondary Reform
33 pages
Spiritual Reflection and Growth
100% (2)
Spiritual Reflection and Growth
40 pages
Kahootz 3 Guide
No ratings yet
Kahootz 3 Guide
31 pages
Differentiated Class Activities Design
No ratings yet
Differentiated Class Activities Design
10 pages
ESAB EAGLE Precision Plasma Cutting
No ratings yet
ESAB EAGLE Precision Plasma Cutting
4 pages
Impact of Screen Addiction on Children
No ratings yet
Impact of Screen Addiction on Children
2 pages
HBR Guide To Navigating The Toxic Workplace Harvard Business Review PDF Version
No ratings yet
HBR Guide To Navigating The Toxic Workplace Harvard Business Review PDF Version
105 pages
Top 100 Hedge Funds to Watch 2023
No ratings yet
Top 100 Hedge Funds to Watch 2023
7 pages
A Wilderness Messenger
No ratings yet
A Wilderness Messenger
5 pages
Divergence (Miraculous Ladybug Rewrite by DepressedTeacupInc, TwilightMaster15)
No ratings yet
Divergence (Miraculous Ladybug Rewrite by DepressedTeacupInc, TwilightMaster15)
674 pages
Syntactic: Phenomena
No ratings yet
Syntactic: Phenomena
452 pages
Macasaet Contempt Case Analysis
No ratings yet
Macasaet Contempt Case Analysis
4 pages
The Materiality of Terracotta Sculpture in Early Modern Europe 1st Edition Zuzanna Sarnecka (Editor) PDF Available
No ratings yet
The Materiality of Terracotta Sculpture in Early Modern Europe 1st Edition Zuzanna Sarnecka (Editor) PDF Available
101 pages
Effect of Pole and Zero On Stability With Example
No ratings yet
Effect of Pole and Zero On Stability With Example
13 pages
E6-Test For Unit 5
No ratings yet
E6-Test For Unit 5
8 pages
Requisites of Good Governance
No ratings yet
Requisites of Good Governance
6 pages
HPGD4606 Practicum SG - Emay23
No ratings yet
HPGD4606 Practicum SG - Emay23
33 pages
EE 392 Measurement Lab Manual PDF
No ratings yet
EE 392 Measurement Lab Manual PDF
29 pages
Adolescent Sensation Awareness Guide
No ratings yet
Adolescent Sensation Awareness Guide
8 pages
Russo-Japanese War Causes
100% (1)
Russo-Japanese War Causes
10 pages
Eugence Kevane, Jesus The Divine Teacher
No ratings yet
Eugence Kevane, Jesus The Divine Teacher
28 pages
Elbow Joint Physiotherapy Techniques
No ratings yet
Elbow Joint Physiotherapy Techniques
16 pages
Engineering Mechanics Exercises
No ratings yet
Engineering Mechanics Exercises
3 pages
Data Privacy Act Clarifications
No ratings yet
Data Privacy Act Clarifications
5 pages
Document Analysis
0% (2)
Document Analysis
4 pages
Discharge of Contract
No ratings yet
Discharge of Contract
17 pages
General Chemistry Chapter 2
No ratings yet
General Chemistry Chapter 2
8 pages
The Rise of Ethnopopulism in Latin America: Raúl L. Madrid
No ratings yet
The Rise of Ethnopopulism in Latin America: Raúl L. Madrid
35 pages
Avoiding Structural Failures in BMH Equipment
No ratings yet
Avoiding Structural Failures in BMH Equipment
6 pages
Things Fall Apart Gender Roles
0% (1)
Things Fall Apart Gender Roles
4 pages

Practical1c.ipynb - Colab

Uploaded by

Practical1c.ipynb - Colab

Uploaded by

11/30/24, 3:34 PM Practical1c.

# Import required libraries

# Create a sample dataset

# Label Encoding for 'Category' column

After Label Encoding:

# Min-Max Scaling for 'Income'

# Binarization for 'Income' with a threshold of 75,000

Income_MinMax Age_Standardized Income_Binary

# Save the processed dataset

Processed dataset saved as 'processed_data.csv'

You might also like