Pandas DataFrame Notes - 12pages-Pages-7

The document discusses working with pivot tables in pandas, focusing on transforming long format data into wide format and vice versa using methods like pivot, unstack, and melt. It also covers handling dates and times, including creating Timestamps and Periods, and managing hierarchical indexes with MultiIndex. Additionally, it provides examples of converting strings to Timestamps and Periods, emphasizing the utility of PeriodIndex for time-series data.

Uploaded by

Sàazón Kasula

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views1 page

Pandas DataFrame Notes - 12pages-Pages-7

Uploaded by

Sàazón Kasula

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Pivot Tables: working with long and wide data Working with dates, times and their indexes

These features work with and often create Dates and time – points and spans
hierarchical or multi-level Indexes; With its focus on time-series data, pandas has a suite of
(the pandas MultiIndex is powerful and complex). tools for managing dates and time: either as a point in
time (a Timestamp) or as a span of time (a Period).
Pivot, unstack, stack and melt t = [Link]('2013-01-01')
Pivot tables move from long format to wide format data t = [Link]('2013-01-01 [Link]')
# Let's start with data in long format t = [Link]('2013-01-01 [Link].7')
from StringIO import StringIO # python2.7 p = [Link]('2013-01-01', freq='M')
#from io import StringIO # python 3 Note: Timestamps should be in range 1678 and 2261
data = """Date,Pollster,State,Party,Est years. (Check [Link] and [Link]).
13/03/2014, Newspoll, NSW, red, 25
13/03/2014, Newspoll, NSW, blue, 28 A Series of Timestamps or Periods
13/03/2014, Newspoll, Vic, red, 24 ts = ['2015-04-01', '2014-04-02']
13/03/2014, Newspoll, Vic, blue, 23
13/03/2014, Galaxy, NSW, red, 23 # Series of Timestamps (good)
13/03/2014, Galaxy, NSW, blue, 24 s = pd.to_datetime([Link](ts))
13/03/2014, Galaxy, Vic, red, 26
13/03/2014, Galaxy, Vic, blue, 25 # Series of Periods (hard to make)
13/03/2014, Galaxy, Qld, red, 21 s = [Link](
13/03/2014, Galaxy, Qld, blue, 27""" [[Link](x, freq='M') for x in ts] )
df = pd.read_csv(StringIO(data), s = [Link]([Link](ts,freq='D'))
header=0, skipinitialspace=True) Note: While Periods make a very useful index; they may
be less useful in a Series.
# pivot to wide format on 'Party' column
# 1st: set up a MultiIndex for other cols From non-standard strings to Timestamps
df1 = df.set_index(['Date', 'Pollster', t = ['[Link].7654-JAN092002',
'State']) '[Link].6589-FEB082016']
# 2nd: do the pivot s = [Link](pd.to_datetime(t,
wide1 = [Link](columns='Party') format="%H:%M:%S.%f-%b%d%Y"))
Also: %B = full month name; %m = numeric month;
# unstack to wide format on State / Party %y = year without century; and more …
# 1st: MultiIndex all but the Values col
df2 = df.set_index(['Date', 'Pollster', Dates and time – stamps and spans as indexes
'State', 'Party']) An index of Timestamps is a DatetimeIndex.
# 2nd: unstack a column to go wide on it An index of Periods is a PeriodIndex.
wide2 = [Link]('State') date_strs = ['2014-01-01', '2014-04-01',
wide3 = [Link]() # pop last index '2014-07-01', '2014-10-01']

# Use stack() to get back to long format dti = [Link](date_strs)

long1 = [Link]()
# Then use reset_index() to remove the pid = [Link](date_strs, freq='D')
# MultiIndex. pim = [Link](date_strs, freq='M')
long2 = long1.reset_index() piq = [Link](date_strs, freq='Q')
# Or melt() back to long format print (pid[1] - pid[0]) # 90 days
# 1st: flatten the column index print (pim[1] - pim[0]) # 3 months
[Link] = ['_'.join(col).strip() print (piq[1] - piq[0]) # 1 quarter
for col in [Link]]
# 2nd: remove the MultiIndex time_strs = ['2015-01-01 [Link].12345',
wdf = wide1.reset_index() '2015-01-01 [Link].67890']
# 3rd: melt away pis = [Link](time_strs, freq='U')
long3 = [Link](wdf, value_vars=
['Est_blue', 'Est_red'], [Link] = pd.period_range('2015-01',
var_name='Party', id_vars=['Date', periods=len(df), freq='M')
'Pollster', 'State'])
Note: See documentation, there are many arguments to dti = pd.to_datetime(['04-01-2012'],
these methods. dayfirst=True) # Australian date format
pi = pd.period_range('1960-01-01',
'2015-12-31', freq='M')
Hint: unless you are working in less than seconds,
prefer PeriodIndex over DateTimeImdex.

Version 30 April 2017 - [Draft – Mark Graph – mark dot the dot graph at gmail dot com – @Mark_Graph on twitter]
7

Data Science Unit 2 Second Half Notes
No ratings yet
Data Science Unit 2 Second Half Notes
18 pages
Pandas PDF
No ratings yet
Pandas PDF
171 pages
Pandas Data Wrangling Cheatsheet Datacamp PDF
No ratings yet
Pandas Data Wrangling Cheatsheet Datacamp PDF
1 page
Data Aggregation and Time Series Analysis
No ratings yet
Data Aggregation and Time Series Analysis
68 pages
Top Machine Learning Artificial Intelligence AI Data Science Cheat Sheets ForML & Deep Learning Engineers
No ratings yet
Top Machine Learning Artificial Intelligence AI Data Science Cheat Sheets ForML & Deep Learning Engineers
14 pages
Comprehensive Pandas Guide
No ratings yet
Comprehensive Pandas Guide
171 pages
From Arrays From Tuples From Product From Levels and Codes
No ratings yet
From Arrays From Tuples From Product From Levels and Codes
22 pages
Pandas Quick Start Guide
No ratings yet
Pandas Quick Start Guide
23 pages
Pandas
No ratings yet
Pandas
44 pages
Week 10 Intro Time Series
No ratings yet
Week 10 Intro Time Series
34 pages
Pandas Indexing and Data Handling
No ratings yet
Pandas Indexing and Data Handling
44 pages
Python Data Science Cheat Sheet
97% (33)
Python Data Science Cheat Sheet
11 pages
10 Minutes To Pandas - Pandas 2.1.1 Documentation
No ratings yet
10 Minutes To Pandas - Pandas 2.1.1 Documentation
24 pages
Lab-3 Pandas Library
No ratings yet
Lab-3 Pandas Library
14 pages
Pandas Cheat Sheet
No ratings yet
Pandas Cheat Sheet
2 pages
Pandas 1
No ratings yet
Pandas 1
50 pages
Pandas
No ratings yet
Pandas
24 pages
Pandas Data Reshaping Cheat Sheet
No ratings yet
Pandas Data Reshaping Cheat Sheet
1 page
Pandas: Import
100% (1)
Pandas: Import
13 pages
Pandas Module (Part-I)
No ratings yet
Pandas Module (Part-I)
36 pages
Pandas Merged
No ratings yet
Pandas Merged
2 pages
Data Science Data Manipulation With Pandas
No ratings yet
Data Science Data Manipulation With Pandas
77 pages
Pandas DataFrame Notes
No ratings yet
Pandas DataFrame Notes
13 pages
Pandas
No ratings yet
Pandas
41 pages
Pandas Guide for Beginners
No ratings yet
Pandas Guide for Beginners
18 pages
Introduction To Pandas in Data Analytics
No ratings yet
Introduction To Pandas in Data Analytics
12 pages
Python For Data Science: Advanced Indexing Data Wrangling in Pandas Cheat Sheet Combining Data
No ratings yet
Python For Data Science: Advanced Indexing Data Wrangling in Pandas Cheat Sheet Combining Data
1 page
Pandas Data Wrangling Cheat Sheet
No ratings yet
Pandas Data Wrangling Cheat Sheet
2 pages
Notes - EDA-Unit2
No ratings yet
Notes - EDA-Unit2
43 pages
Quick Start Guide to Pandas
No ratings yet
Quick Start Guide to Pandas
26 pages
Pandas Complete Notes
No ratings yet
Pandas Complete Notes
105 pages
Data Wrangling Cheat Sheet
No ratings yet
Data Wrangling Cheat Sheet
1 page
Pandas Cheat Sheet for Data Manipulation
No ratings yet
Pandas Cheat Sheet for Data Manipulation
1 page
Data Analysis With PANDAS: Cheat Sheet
86% (7)
Data Analysis With PANDAS: Cheat Sheet
4 pages
DataFrame Operations and Visualizations
100% (1)
DataFrame Operations and Visualizations
20 pages
3 Dataframes
No ratings yet
3 Dataframes
12 pages
Python Programming Pandas Across Examples
100% (1)
Python Programming Pandas Across Examples
350 pages
Lecture 14
No ratings yet
Lecture 14
33 pages
Pandas
No ratings yet
Pandas
18 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
33 pages
Hierarchical Indexing in Pandas
No ratings yet
Hierarchical Indexing in Pandas
14 pages
05getting Started With Pandas
No ratings yet
05getting Started With Pandas
44 pages
Pandas
No ratings yet
Pandas
23 pages
Data Wrangling with Pandas Guide
No ratings yet
Data Wrangling with Pandas Guide
1 page
Python & Pandas for Beginners
No ratings yet
Python & Pandas for Beginners
29 pages
Time Series
No ratings yet
Time Series
27 pages
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
100% (1)
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
12 pages
Data Wrangling With Python and Pandas
No ratings yet
Data Wrangling With Python and Pandas
7 pages
Pandas DataFrame Notes - 12pages-Pages-4
No ratings yet
Pandas DataFrame Notes - 12pages-Pages-4
1 page
Seismic Behaviors and Resilient Capacity of CFRP-confined Concrete Columns
No ratings yet
Seismic Behaviors and Resilient Capacity of CFRP-confined Concrete Columns
12 pages
Seismic Performance Assessment of A
No ratings yet
Seismic Performance Assessment of A
19 pages
Marconite - Earthing Compounds - Granular Marconite Compound Earthing
No ratings yet
Marconite - Earthing Compounds - Granular Marconite Compound Earthing
8 pages
Current Transformer Basics - Understanding Ratio, Polarity, and Class
No ratings yet
Current Transformer Basics - Understanding Ratio, Polarity, and Class
25 pages
Z-Transform Fundamentals and Applications
No ratings yet
Z-Transform Fundamentals and Applications
5 pages
An Economic Evaluation System For Building Construction Projects in The Conceputal Phase
No ratings yet
An Economic Evaluation System For Building Construction Projects in The Conceputal Phase
6 pages
TJ Bodies Place Demands Before Extending Term: Kathmandu
No ratings yet
TJ Bodies Place Demands Before Extending Term: Kathmandu
12 pages
How To Play The Back
No ratings yet
How To Play The Back
7 pages
C Programming Lab Manual
No ratings yet
C Programming Lab Manual
15 pages
250+ Coding Interview Questions Asked in Service-Based Companies (With Company Tags & Links)
100% (2)
250+ Coding Interview Questions Asked in Service-Based Companies (With Company Tags & Links)
17 pages
3 Secure File Management Implementation Guide
No ratings yet
3 Secure File Management Implementation Guide
5 pages
Assembly Language: Alice Andrea Briceño Murcia
No ratings yet
Assembly Language: Alice Andrea Briceño Murcia
24 pages
Inheritance in C# Explained
No ratings yet
Inheritance in C# Explained
24 pages
21MCME06
No ratings yet
21MCME06
1 page
Tower of Hanoi Console Game Code
No ratings yet
Tower of Hanoi Console Game Code
2 pages
Excel Lookup Functions Guide
No ratings yet
Excel Lookup Functions Guide
21 pages
GDB Debugging Guide
No ratings yet
GDB Debugging Guide
7 pages
1O6 S4HANAX BB ConfigGuide EN XX
No ratings yet
1O6 S4HANAX BB ConfigGuide EN XX
24 pages
C Online Compiler
No ratings yet
C Online Compiler
1 page
SQL Injection Basics and Prevention
No ratings yet
SQL Injection Basics and Prevention
67 pages
Clone and Rename Oracle Database
No ratings yet
Clone and Rename Oracle Database
6 pages
Data Engineering with Scala & Spark Program
No ratings yet
Data Engineering with Scala & Spark Program
27 pages
JavaScript Basics for Beginners
No ratings yet
JavaScript Basics for Beginners
62 pages
50 Ts
No ratings yet
50 Ts
262 pages
OS File Directory Simulation
No ratings yet
OS File Directory Simulation
8 pages
Web Programming Syllabus 2023-24
No ratings yet
Web Programming Syllabus 2023-24
6 pages
Kwasu-Csc102 Questions
No ratings yet
Kwasu-Csc102 Questions
26 pages
C++ Programming D. S PDF Download
No ratings yet
C++ Programming D. S PDF Download
162 pages
Java Output Quiz for Beginners
No ratings yet
Java Output Quiz for Beginners
26 pages
VSB Java Syllabus
No ratings yet
VSB Java Syllabus
4 pages
Assembly Language
No ratings yet
Assembly Language
27 pages
Risc-V Bitmanip Extension Document Version 0.90: Editor: Clifford Wolf Symbiotic GMBH June 10, 2019
No ratings yet
Risc-V Bitmanip Extension Document Version 0.90: Editor: Clifford Wolf Symbiotic GMBH June 10, 2019
72 pages
Python Basics for AI Students
No ratings yet
Python Basics for AI Students
12 pages
TinyOS & TOSSIM for WSN Simulation
No ratings yet
TinyOS & TOSSIM for WSN Simulation
9 pages
Web Development Interview Questions
No ratings yet
Web Development Interview Questions
5 pages
5 Steps To A 5: AP Computer Science A 2022 Dean R. Johnson Updated 2025
No ratings yet
5 Steps To A 5: AP Computer Science A 2022 Dean R. Johnson Updated 2025
80 pages
Decision Trees: Classification & Regression
No ratings yet
Decision Trees: Classification & Regression
14 pages
Daa Viva Questions
No ratings yet
Daa Viva Questions
30 pages

Pandas DataFrame Notes - 12pages-Pages-7

Uploaded by

Pandas DataFrame Notes - 12pages-Pages-7

Uploaded by

Pivot Tables: working with long and wide data Working with dates, times and their indexes

# Use stack() to get back to long format dti = [Link](date_strs)

You might also like