0% found this document useful (0 votes)

73 views5 pages

Pandas Data Manipulation Techniques

This document discusses various techniques for manipulating data in Pandas such as filtering, selecting, sorting, aggregating, handling missing values, grouping, pivoting, combining, and applying functions to DataFrames. Key operations include filtering rows based on conditions, selecting columns, sorting by column values, calculating summary statistics, dropping rows with missing values, merging DataFrames, grouping and aggregating data, creating pivot tables, concatenating DataFrames horizontally and vertically, and applying custom functions to columns.

Uploaded by

Manan Sharma

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

73 views5 pages

Pandas Data Manipulation Techniques

Uploaded by

Manan Sharma

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

day09-pandas-data-manipulation

February 2, 2024

Pandas Data Manipulation –by Punith V T

[1]: import pandas as pd

[58]: #sample data

data = { "A" : [1,2,3,4,5,10],
"B": ["bengaluru","channai","delhi","tumkur","coimbator","bengaluru"]}

df=pd.DataFrame(data)
df

[58]: A B
0 1 bengaluru
1 2 channai
2 3 delhi
3 4 tumkur
4 5 coimbator
5 10 bengaluru

1. Filtering Data: Filtering rows based on a condition.

[12]: gr2= df[df["A"]>2]

gr2

[12]: A B
2 3 delhi
3 4 tumkur
4 5 coimbator

2. Selecting Columns:
Selecting specific columns from a DataFrame.
[20]: sc = df[["B"]]

print(sc)

type(sc)

1
B
0 bengaluru
1 channai
2 delhi
3 tumkur
4 coimbator

[20]: pandas.core.frame.DataFrame

3.Sorting Data:
Sorting DataFrame by one or more columns.
[29]: sort = df.sort_values(by="B")
sort

[29]: A B
0 1 bengaluru
1 2 channai
4 5 coimbator
2 3 delhi
3 4 tumkur

[31]: #descending order

desort = df.sort_values(by="B")
desort

[31]: A B
0 1 bengaluru
1 2 channai
4 5 coimbator
2 3 delhi
3 4 tumkur

4. Aggregating Data:
Calculating summary statistics like mean, sum, count, etc.
[45]: meanA =df["A"].mean()
meanA

[45]: 3.0

[46]: valueCountA =df["A"].value_counts()

valueCountA

[46]: A
1 1
2 1

2
3 1
4 1
5 1
Name: count, dtype: int64

5. Handling Missing Data:

Dealing with missing values in your DataFrame
[51]: import pandas as pd
# sample
data_with_missing ={ "A": [1,2,3,None,4],
"B": ["a","b",None,"d","e"]}
df_miss=pd.DataFrame(data_with_missing)

df_miss.dropna()

[51]: A B
0 1.0 a
1 2.0 b
4 4.0 e

[52]: # Create two DataFrames

df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value1': [10, 20, 30]})
df2 = pd.DataFrame({'key': ['B', 'C', 'D'], 'value2': [40, 50, 60]})

# Merge based on 'key' column

merged_df = pd.merge(df1, df2, on='key', how='inner')
print(merged_df)

key value1 value2

0 B 20 40
1 C 30 50
7. Grouping and Aggregating Data:
Grouping data by one or more columns and applying aggregate functions.
[62]: # Group by 'B' and calculate the sum of 'A' for each group
group_df = df.groupby('B')["A"].sum().reset_index()
print(group_df)

B A
0 bengaluru 11
1 channai 2
2 coimbator 5
3 delhi 3
4 tumkur 4
8. Pivot Tables:

3
Creating pivot tables to summarize and reshape data.
[63]: # Create a pivot table to show the mean 'A' for each 'B' category
pivot_table = df.pivot_table(values='A', index='B', aggfunc='mean')
print(pivot_table)

A
B
bengaluru 5.5
channai 2.0
coimbator 5.0
delhi 3.0
tumkur 4.0
9. Combining Data:
Concatenating or appending multiple DataFrames vertically or horizontally.
[65]: # Concatenate two DataFrames Horizontaly
df_concatenated = pd.concat([df1, df2], axis=1)
print(df_concatenated)

key value1 key value2

0 A 10 B 40
1 B 20 C 50
2 C 30 D 60

[69]: # Append one DataFrame to another

df_appended = df1._append(df2,ignore_index=True)
print(df_appended)

key value1 value2

0 A 10.0 NaN
1 B 20.0 NaN
2 C 30.0 NaN
3 B NaN 40.0
4 C NaN 50.0
5 D NaN 60.0
Applying function to the data
[70]: def square(x):
return x*x
# Apply the custom function to 'A' column
df["sq_A"]= df["A"].apply(square)
df

[70]: A B sq_A
0 1 bengaluru 1
1 2 channai 4

4
2 3 delhi 9
3 4 tumkur 16
4 5 coimbator 25
5 10 bengaluru 100

[ ]:

Day 4 Data Manipulation With Pandas
No ratings yet
Day 4 Data Manipulation With Pandas
4 pages
Pandas For Python Pro Level Cheat Sheet
No ratings yet
Pandas For Python Pro Level Cheat Sheet
14 pages
Day 10 Pandasdatacleaning
No ratings yet
Day 10 Pandasdatacleaning
6 pages
Data Manipulation in Python Using Pandas
No ratings yet
Data Manipulation in Python Using Pandas
12 pages
Data Manipulation With Pandas
No ratings yet
Data Manipulation With Pandas
8 pages
Data Wrangling
No ratings yet
Data Wrangling
8 pages
Unit-2 Bda
No ratings yet
Unit-2 Bda
11 pages
Data Manipulation With Pandas
No ratings yet
Data Manipulation With Pandas
19 pages
Unit2 Part2 Da
No ratings yet
Unit2 Part2 Da
45 pages
PW2 DataCleaning
No ratings yet
PW2 DataCleaning
6 pages
Lab 1 ML Lab
No ratings yet
Lab 1 ML Lab
15 pages
Pandas Python Data Analysis Guide
No ratings yet
Pandas Python Data Analysis Guide
32 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Pandas Operations Guide
No ratings yet
Pandas Operations Guide
6 pages
Pandas
No ratings yet
Pandas
4 pages
Data Wrangling & Data Manipulation With Pandas
No ratings yet
Data Wrangling & Data Manipulation With Pandas
6 pages
IntroToPython Unit 5
No ratings yet
IntroToPython Unit 5
42 pages
Pandas AI ML Python Software Engineering
No ratings yet
Pandas AI ML Python Software Engineering
63 pages
Pandas Essential Functions Part1
No ratings yet
Pandas Essential Functions Part1
32 pages
Practice 1
No ratings yet
Practice 1
45 pages
Pandas 1
No ratings yet
Pandas 1
13 pages
10-Day Learning Plan - Data Handling & Cleaning
No ratings yet
10-Day Learning Plan - Data Handling & Cleaning
7 pages
Comprehensive Pandas Guide
No ratings yet
Comprehensive Pandas Guide
171 pages
Understanding df.isnull().sum() in Pandas
No ratings yet
Understanding df.isnull().sum() in Pandas
8 pages
CSE445 NSU Week - 3
No ratings yet
CSE445 NSU Week - 3
48 pages
Pandas PDF
No ratings yet
Pandas PDF
171 pages
Introduction To Pandas in Data Analytics
No ratings yet
Introduction To Pandas in Data Analytics
12 pages
Data Prep & EDA for Python Users
No ratings yet
Data Prep & EDA for Python Users
12 pages
Pandas CheatSheet 1
No ratings yet
Pandas CheatSheet 1
15 pages
Pandas For Machine Learning
No ratings yet
Pandas For Machine Learning
10 pages
Pandas
No ratings yet
Pandas
13 pages
Python 2.1.2
No ratings yet
Python 2.1.2
7 pages
000 - Data Manipulation With Pandas - DataCamp
100% (1)
000 - Data Manipulation With Pandas - DataCamp
5 pages
Data Cleaning in Python
No ratings yet
Data Cleaning in Python
14 pages
Data Wrangling
No ratings yet
Data Wrangling
15 pages
Lec 4
No ratings yet
Lec 4
9 pages
Python Data Science: Pandas & ML Basics
100% (1)
Python Data Science: Pandas & ML Basics
41 pages
Filtering Data in Pandas with Python
No ratings yet
Filtering Data in Pandas with Python
52 pages
Pandas
No ratings yet
Pandas
30 pages
Data Cleaning & Preparation
100% (2)
Data Cleaning & Preparation
2 pages
Getting Start With Pandas
No ratings yet
Getting Start With Pandas
11 pages
Lab #2 - Data Analysis With NumPy and Pandas
No ratings yet
Lab #2 - Data Analysis With NumPy and Pandas
7 pages
Lab 9
No ratings yet
Lab 9
9 pages
Chapter - 4 Data Analysis With Pandas
No ratings yet
Chapter - 4 Data Analysis With Pandas
60 pages
Pandas Part2
No ratings yet
Pandas Part2
14 pages
LP II Practical
No ratings yet
LP II Practical
5 pages
Assignment 2
No ratings yet
Assignment 2
6 pages
Lesson 3. Data Preparation and Structuring 1 Data Cleaning
No ratings yet
Lesson 3. Data Preparation and Structuring 1 Data Cleaning
36 pages
Pandas: Import
100% (1)
Pandas: Import
13 pages
Pandas Trick Ques
No ratings yet
Pandas Trick Ques
2 pages
Pandas
No ratings yet
Pandas
7 pages
Pandas
No ratings yet
Pandas
26 pages
ProgrammingForDS16 Rdatamanipulation
No ratings yet
ProgrammingForDS16 Rdatamanipulation
20 pages
Python Pandas: 12 Data Manipulation Techniques
100% (2)
Python Pandas: 12 Data Manipulation Techniques
19 pages
Panasonic NV Gs6, Gs17, Gs18, Gs21, Gs25, Gs28, Gs35, Gs38
100% (1)
Panasonic NV Gs6, Gs17, Gs18, Gs21, Gs25, Gs28, Gs35, Gs38
110 pages
Bangladesh Railway E-Ticket Details
No ratings yet
Bangladesh Railway E-Ticket Details
1 page
Instrucciones para Instalar Cilindros de Dirección Con Sensores de Posición en Determinadas Motoniveladoras
No ratings yet
Instrucciones para Instalar Cilindros de Dirección Con Sensores de Posición en Determinadas Motoniveladoras
57 pages
SPPM R22 Lesson Plan
No ratings yet
SPPM R22 Lesson Plan
4 pages
BUS800 All Sections D2L Connect Fdoc W25
No ratings yet
BUS800 All Sections D2L Connect Fdoc W25
15 pages
Assembly Language Lab Manual
No ratings yet
Assembly Language Lab Manual
13 pages
PVC160203PGL01 LCD Module Specs
No ratings yet
PVC160203PGL01 LCD Module Specs
20 pages
TrackUnit Raw TU600
No ratings yet
TrackUnit Raw TU600
6 pages
IdeaLLiance - PRISM, Publishing Requirements For Industry Standard Metadata v2.2 - The PRISM-PAM Inline Markup Specification, 2014
No ratings yet
IdeaLLiance - PRISM, Publishing Requirements For Industry Standard Metadata v2.2 - The PRISM-PAM Inline Markup Specification, 2014
19 pages
Aadhar Tours and Travels PVT LTD
No ratings yet
Aadhar Tours and Travels PVT LTD
76 pages
Reliability maintainability and risk practical methods for engineers including reliability centred maintenance and safety related systems 7th Edition David J. Smith Bsc Phd Ceng Fiee Fiqa Honfsars Migase. full
No ratings yet
Reliability maintainability and risk practical methods for engineers including reliability centred maintenance and safety related systems 7th Edition David J. Smith Bsc Phd Ceng Fiee Fiqa Honfsars Migase. full
75 pages
COE480 - Lecture1 Exercises MIPS
No ratings yet
COE480 - Lecture1 Exercises MIPS
21 pages
Malaysia Taxation Exam Paper 2009
No ratings yet
Malaysia Taxation Exam Paper 2009
10 pages
Roadmap to Automation Testing
No ratings yet
Roadmap to Automation Testing
2 pages
Exam SOPs for Software Students
No ratings yet
Exam SOPs for Software Students
3 pages
Materials Management Exam Answers
No ratings yet
Materials Management Exam Answers
6 pages
"Counting My Blessings" Lord Lo
No ratings yet
"Counting My Blessings" Lord Lo
3 pages
Jeppesen Legend
100% (1)
Jeppesen Legend
11 pages
PAN Card Application & Correction Form
No ratings yet
PAN Card Application & Correction Form
1 page
F.sq-Wi.013.2 Work Instruction For Performing Test at Switch Gear
No ratings yet
F.sq-Wi.013.2 Work Instruction For Performing Test at Switch Gear
3 pages
Architecture and Planning SIEM Deploy L4 Quiz Attempt Review 2
No ratings yet
Architecture and Planning SIEM Deploy L4 Quiz Attempt Review 2
11 pages
Analog Job Prep Guide for ECE Freshers
No ratings yet
Analog Job Prep Guide for ECE Freshers
13 pages
Internship Report - Frontend Developer at Coding75
No ratings yet
Internship Report - Frontend Developer at Coding75
10 pages
LJBA - Key To Correction
No ratings yet
LJBA - Key To Correction
1 page
Part1 Uvm Macros Config DB
No ratings yet
Part1 Uvm Macros Config DB
8 pages
3D Tree Models for Designers
No ratings yet
3D Tree Models for Designers
2 pages
Obsticale Avoidance Robot Fabrication
No ratings yet
Obsticale Avoidance Robot Fabrication
36 pages
Chapter 02 Organization Strategy and Project Selection
100% (1)
Chapter 02 Organization Strategy and Project Selection
7 pages
FX120 Manual
No ratings yet
FX120 Manual
24 pages
Online Gaming Chat Drama
No ratings yet
Online Gaming Chat Drama
49 pages

Pandas Data Manipulation Techniques

Uploaded by

Pandas Data Manipulation Techniques

Uploaded by

day09-pandas-data-manipulation

Pandas Data Manipulation –by Punith V T

[58]: #sample data

1. Filtering Data: Filtering rows based on a condition.

[31]: #descending order

[46]: valueCountA =df["A"].value_counts()

5. Handling Missing Data:

[52]: # Create two DataFrames

# Merge based on 'key' column

key value1 value2

key value1 key value2

[69]: # Append one DataFrame to another

key value1 value2

You might also like