Pandas DataFrame Notes - 12pages-Pages-11

The document discusses handling missing and non-finite data in pandas, highlighting the use of constructs like np.nan and None to represent missing values. It also covers working with categorical data, including creating, ordering, and renaming categories, as well as converting between data types. Key operations such as filling missing values, dropping rows or columns with NaN, and managing infinite numbers are also addressed.

Uploaded by

Sàazón Kasula

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views1 page

Pandas DataFrame Notes - 12pages-Pages-11

Uploaded by

Sàazón Kasula

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Working with missing and non-finite data Working with Categorical Data

Working with missing data Categorical data

Pandas uses the not-a-number construct ([Link] and The pandas Series has an R factors-like data type for
float('nan')) to indicate missing data. The Python None encoding categorical data.
can arise in data as well. It is also treated as missing s = Series(['a','b','a','c','b','d','a'],
data; as is the pandas not-a-time construct dtype='category')
([Link]). df['B'] = df['A'].astype('category')
Note: the key here is to specify the "category" data type.
Missing data in a Series Note: categories will be ordered on creation if they are
s = Series( [8,None,float('nan'),[Link]]) sortable. This can be turned off. See ordering below.
#[8, NaN, NaN, NaN]
[Link]() #[False, True, True, True] Convert back to the original data type
[Link]()#[True, False, False, False] s = Series(['a','b','a','c','b','d','a'],
[Link](0)#[8, 0, 0, 0] dtype='category')
s = [Link]('string')
Missing data in a DataFrame
df = [Link]() # drop all rows with NaN Ordering, reordering and sorting
df = [Link](axis=1) # same for cols s = Series(list('abc'), dtype='category')
df=[Link](how='all') #drop all NaN row print ([Link])
df=[Link](thresh=2) # drop 2+ NaN in r s=[Link].reorder_categories(['b','c','a'])
# only drop row if NaN in a specified col s = [Link]()
df = [Link](df['col'].notnull()) [Link] = False
Trap: category must be ordered for it to be sorted
Recoding missing data
[Link](0, inplace=True) # [Link]  0 Renaming categories
s = df['col'].fillna(0) # [Link]  0 s = Series(list('abc'), dtype='category')
df = [Link](r'\s+', [Link], [Link] = [1, 2, 3] # in place
regex=True) # white space  [Link] s = [Link].rename_categories([4,5,6])
# using a comprehension ...
Non-finite numbers [Link] = ['Group ' + str(i)
With floating point numbers, pandas provides for for i in [Link]]
positive and negative infinity. Trap: categories must be uniquely named
s = Series([float('inf'), float('-inf'),
[Link], -[Link]]) Adding new categories
Pandas treats integer comparisons with plus or minus s = [Link].add_categories([4])
infinity as expected.
Removing categories
Testing for finite numbers s = [Link].remove_categories([4])
(using the data from the previous example) [Link].remove_unused_categories() #inplace
b = [Link](s)

Version 30 April 2017 - [Draft – Mark Graph – mark dot the dot graph at gmail dot com – @Mark_Graph on twitter]
11

Practice 1
No ratings yet
Practice 1
45 pages
Traversing Dataframe Elements Using: Iterrows, Iteritems and Itertuples
No ratings yet
Traversing Dataframe Elements Using: Iterrows, Iteritems and Itertuples
8 pages
Pandas
No ratings yet
Pandas
35 pages
Pandas DataFrame Basics Guide
No ratings yet
Pandas DataFrame Basics Guide
32 pages
Pandas DataFrame Notes
No ratings yet
Pandas DataFrame Notes
13 pages
Pandas: Import
100% (1)
Pandas: Import
13 pages
Pandas AI ML Python Software Engineering
No ratings yet
Pandas AI ML Python Software Engineering
63 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Handling Missing Data in Pandas by Jaume Boguñá
No ratings yet
Handling Missing Data in Pandas by Jaume Boguñá
17 pages
Pandas
No ratings yet
Pandas
63 pages
Lecture - 2 Pandas
No ratings yet
Lecture - 2 Pandas
24 pages
Data Handling for Data Scientists
No ratings yet
Data Handling for Data Scientists
163 pages
5 - Pandas - Series - Ipynb - Colab
No ratings yet
5 - Pandas - Series - Ipynb - Colab
7 pages
Introduction to Pandas Library
No ratings yet
Introduction to Pandas Library
31 pages
Python & Pandas for Beginners
No ratings yet
Python & Pandas for Beginners
29 pages
Grade 11 Pandas Notes and Worksheet
No ratings yet
Grade 11 Pandas Notes and Worksheet
5 pages
Final Formatted After Iloc Loc
No ratings yet
Final Formatted After Iloc Loc
34 pages
Top Python Questions 1735201448
No ratings yet
Top Python Questions 1735201448
25 pages
Essential Pandas DataFrame Guide
No ratings yet
Essential Pandas DataFrame Guide
9 pages
Unit2 Part2 Da
No ratings yet
Unit2 Part2 Da
45 pages
DWV Unit1
No ratings yet
DWV Unit1
102 pages
Pandas Worksheets ALL
100% (1)
Pandas Worksheets ALL
8 pages
Python Pandas: Data Manipulation Guide
No ratings yet
Python Pandas: Data Manipulation Guide
84 pages
Pandas
No ratings yet
Pandas
49 pages
Pandas DataFrame Notes
67% (3)
Pandas DataFrame Notes
13 pages
Pandas
No ratings yet
Pandas
13 pages
Introduction To Pandas and Matplotlib: Dr. D. Kothandaraman Associate Professor, SCOPE, VITAP-University
No ratings yet
Introduction To Pandas and Matplotlib: Dr. D. Kothandaraman Associate Professor, SCOPE, VITAP-University
30 pages
Data Science - Sec4
No ratings yet
Data Science - Sec4
16 pages
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
100% (1)
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
12 pages
Pandas
No ratings yet
Pandas
7 pages
2 - 4 Data Cleaning
No ratings yet
2 - 4 Data Cleaning
24 pages
Pandas Data Structures Guide
No ratings yet
Pandas Data Structures Guide
72 pages
Data Pre-Processing (Pandas)
No ratings yet
Data Pre-Processing (Pandas)
19 pages
Pandas Data Analysis Handbook
No ratings yet
Pandas Data Analysis Handbook
55 pages
Lab 9
No ratings yet
Lab 9
9 pages
Pandas
No ratings yet
Pandas
42 pages
Pandas DataFrame Cheat Sheet Guide
No ratings yet
Pandas DataFrame Cheat Sheet Guide
12 pages
Pandas Summarized Visually in 8
100% (2)
Pandas Summarized Visually in 8
8 pages
Ip Study
No ratings yet
Ip Study
18 pages
IntroToPython Unit 5
No ratings yet
IntroToPython Unit 5
42 pages
Pandas DataFrame Cheat Sheet Guide
No ratings yet
Pandas DataFrame Cheat Sheet Guide
10 pages
Unit III - Pandas - Data Manipulation Using Python
No ratings yet
Unit III - Pandas - Data Manipulation Using Python
15 pages
Pandas Notes
No ratings yet
Pandas Notes
20 pages
Pandas Data Manipulation Techniques
No ratings yet
Pandas Data Manipulation Techniques
82 pages
Pandas DataFrame Cheat Sheet
100% (1)
Pandas DataFrame Cheat Sheet
10 pages
Pandas DataFrame Cheat Sheet
No ratings yet
Pandas DataFrame Cheat Sheet
4 pages
Python Pandas DataFrame Guide
100% (2)
Python Pandas DataFrame Guide
23 pages
Python Data Analysis with Numpy & Pandas
No ratings yet
Python Data Analysis with Numpy & Pandas
19 pages
Module 6
No ratings yet
Module 6
48 pages
Unit 5 Python
No ratings yet
Unit 5 Python
30 pages
EDA Unit2
No ratings yet
EDA Unit2
99 pages
Data Handling with Pandas in Python
No ratings yet
Data Handling with Pandas in Python
14 pages
Data Analytics Preparation & Visualization
No ratings yet
Data Analytics Preparation & Visualization
54 pages
Exp3 Python
No ratings yet
Exp3 Python
15 pages
Pandas DataFrame Notes - 12pages-Pages-4
No ratings yet
Pandas DataFrame Notes - 12pages-Pages-4
1 page
Seismic Behaviors and Resilient Capacity of CFRP-confined Concrete Columns
No ratings yet
Seismic Behaviors and Resilient Capacity of CFRP-confined Concrete Columns
12 pages
Seismic Performance Assessment of A
No ratings yet
Seismic Performance Assessment of A
19 pages
Current Transformer Basics - Understanding Ratio, Polarity, and Class
No ratings yet
Current Transformer Basics - Understanding Ratio, Polarity, and Class
25 pages
Marconite - Earthing Compounds - Granular Marconite Compound Earthing
No ratings yet
Marconite - Earthing Compounds - Granular Marconite Compound Earthing
8 pages
An Economic Evaluation System For Building Construction Projects in The Conceputal Phase
No ratings yet
An Economic Evaluation System For Building Construction Projects in The Conceputal Phase
6 pages
Z-Transform Fundamentals and Applications
No ratings yet
Z-Transform Fundamentals and Applications
5 pages
TJ Bodies Place Demands Before Extending Term: Kathmandu
No ratings yet
TJ Bodies Place Demands Before Extending Term: Kathmandu
12 pages
How To Play The Back
No ratings yet
How To Play The Back
7 pages
UX/UI Designer Portfolio & Projects
No ratings yet
UX/UI Designer Portfolio & Projects
1 page
6ES75131AM030AB0 Datasheet en
No ratings yet
6ES75131AM030AB0 Datasheet en
8 pages
Object Diagram
No ratings yet
Object Diagram
1 page
Maventic Innovative Solutions Ltd. - Placement Notice
No ratings yet
Maventic Innovative Solutions Ltd. - Placement Notice
1 page
ReleaseNotes WiFi 23.90
No ratings yet
ReleaseNotes WiFi 23.90
3 pages
Additive Users Guide Print and Science
No ratings yet
Additive Users Guide Print and Science
126 pages
5.1 - 5.6 Inbuilt Data Structures
No ratings yet
5.1 - 5.6 Inbuilt Data Structures
39 pages
1 s2.0 S1874490722000490 Main
No ratings yet
1 s2.0 S1874490722000490 Main
14 pages
Voice Command Calculator Assistant
No ratings yet
Voice Command Calculator Assistant
8 pages
BMS-0000356 - Part Number Definition - Rev04
No ratings yet
BMS-0000356 - Part Number Definition - Rev04
2 pages
Welcome To IST 380 !: Data Science Programming
No ratings yet
Welcome To IST 380 !: Data Science Programming
73 pages
Arctis 5 Headset Product Guide
No ratings yet
Arctis 5 Headset Product Guide
40 pages
IBM-CBSE AI Project Logbook-1
No ratings yet
IBM-CBSE AI Project Logbook-1
27 pages
ClearCompany REST API Specifications.v1.02
No ratings yet
ClearCompany REST API Specifications.v1.02
76 pages
Creating Threads in Java
No ratings yet
Creating Threads in Java
13 pages
AI-Based Women's Safety System
No ratings yet
AI-Based Women's Safety System
6 pages
Lexical Analysis & Symbol Tables
No ratings yet
Lexical Analysis & Symbol Tables
4 pages
NS Lab
No ratings yet
NS Lab
29 pages
Kulik 2021 CemGEMS - An - Easy To Use - Web (Published - Version)
No ratings yet
Kulik 2021 CemGEMS - An - Easy To Use - Web (Published - Version)
17 pages
Specifying Operations
No ratings yet
Specifying Operations
10 pages
BSC Computer Fundamentals
100% (1)
BSC Computer Fundamentals
9 pages
CV Ok
No ratings yet
CV Ok
2 pages
Using Computer and Managing Files
No ratings yet
Using Computer and Managing Files
51 pages
DHH 805
No ratings yet
DHH 805
4 pages
Test 01 - Test Paper (Botany) - YAKEEN NEET Gujarati 2025
No ratings yet
Test 01 - Test Paper (Botany) - YAKEEN NEET Gujarati 2025
11 pages
Paul Aubin 2017 - Update PDF
No ratings yet
Paul Aubin 2017 - Update PDF
15 pages
SocketException Host Lookup Failures
No ratings yet
SocketException Host Lookup Failures
6 pages
Multiple Choice Set A
No ratings yet
Multiple Choice Set A
5 pages
EAC Setup & Ripping Guide (Combined) - APOLLO
No ratings yet
EAC Setup & Ripping Guide (Combined) - APOLLO
17 pages
Resume - Lalit - P2P R2R
No ratings yet
Resume - Lalit - P2P R2R
2 pages

Pandas DataFrame Notes - 12pages-Pages-11

Uploaded by

Pandas DataFrame Notes - 12pages-Pages-11

Uploaded by

Working with missing and non-finite data Working with Categorical Data

Working with missing data Categorical data

You might also like