PandasGUIA PYTHON-04

The document discusses the Pandas library in Python which provides data structures and analysis tools. It covers Pandas Series and DataFrames, I/O methods like reading/writing CSV, Excel and SQL databases. It also covers data selection, applying functions, data alignment and summarizing DataFrames.

Uploaded by

Danilo Zanichelli

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views1 page

PandasGUIA PYTHON-04

Uploaded by

Danilo Zanichelli

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

> I/O > Retrieving Series/DataFrame Information

Python For Data Science Read and Write to CSV Basic Information

Pandas Basics Cheat Sheet >>> pd.read_csv(‘file.csv’, header=None, nrows=5)

>>> df.to_csv('myDataFrame.csv')
>>>
>>>
>>>
df.shape #(rows,columns)
df.index #Describe index
df.columns #Describe DataFrame columns
>>> df.info() #Info on DataFrame
Learn Pandas Basics online at www.DataCamp.com Read and Write to Excel >>> df.count() #Number of non-NA values

>>> pd.read_excel(‘file.xlsx’)
>>> df.to_excel('dir/myDataFrame.xlsx', sheet_name='Sheet1')
Summary
Read multiple sheets from the same ile df.sum() #Sum of values
Pandas
>>>
>>> df.cumsum() #Cummulative sum of values
>>> xlsx = pd.ExcelFile(‘file.xls’)
>>> df.min()/df.max() #Minimum/maximum values
>>> df = pd.read_excel(xlsx, 'Sheet1')
>>> df.idxmin()/df.idxmax() #Minimum/Maximum index value
>>> df.describe() #Summary statistics
The Pandas library is built on NumPy and provides easy-to-us data
structures and data analysis tools for the Pytho programming language. Read and Write to SQL Query or Database Table >>>
>>>
df.mean() #Mean of values
df.median() #Median of values

Use the following import convention >>> from sqlalchemy import create_engine
>>> engine = create_engine('sqlite:///:memory:')
>>> import pandas as pd >>>
>>>
pd.read_sql("SELECT * FROM my_table;", engine)
pd.read_sql_table('my_table', engine) > Applying Functions
>>> pd.read_sql_query("SELECT * FROM my_table;", engine)
read_sql() is a convenience wrapper around read_sql_table() and read_sql_query() >>> f = lambda x: x*2

> Pandas Data Structures >>> df.to_sql('myDf', engine) >>> df.apply(f) #Apply function
>>> df.applymap(f) #Apply function element-wise

Series
> Selection Also see NumPy Arrays
> Data Alignment
A one-dimensional labeled array a 3
capable of holding any data type Geting
Index
b -5 Internal Data Alignment
c 7
>>> s['b'] #Get one element
-5
NA values are introduced in the indices that don’t overlap:
d 4
>>> s = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd']) >>> df[1:] #Get subset of a DataFrame >>> s3 = pd.Series([7, -2, 3], index=['a', 'c', 'd'])
Country Capital Population
>>> s + s3
1 India New Delhi 1303171035
a 10.0
Dataframe 2 Brazil Brasília 207847528
b NaN
c 5.0
d 7.0
A two-dimensional labele data structure Selecting, Boolean Indexing & Seting
with column of potentially diferent types
By Position Arithmetic Operations with Fill Methods
Columns Country Capital Population
>>> df.iloc[[0],[0]] #Select single value by row & column
You can also do the internal data alignment yourself wit the help of the ill methods:
0 Belgium Brussels 11190846 'Belgium
Index
1 India New Delhi 1303171035 >>> df.iat([0],[0]) >>> s.add(s3, fill _values=0
'Belgium' a 10.
2 Brazil Brasilia 207847528
b -5.
By Label
>>> data = {'Country':
['Belgium', 'India', 'Brazil'], c 5.
'Capital': ['Brussels', 'New Delhi', 'Brasília'], >>> df.loc[[0], ['Country']] #Select single value by row & column labels d 7.
'Population': [11190846, 1303171035, 207847528]} 'Belgium' >>> s.sub(s3, fill_value=2
>>> df = pd.DataFrame(data, >>> df.at([0], ['Country']) >>> s.div(s3, fill_value=4
columns=['Country', 'Capital', 'Population']) 'Belgium' >>> s.mul(s3, fill_value=3)

By Label/Position

>>> df.ix[2] #Select single row of subset of rows

> Dropping Country Brazi
Capital Brasíli
Population 207847528
>>> s.drop(['a', 'c']) #Drop values from rows (axis=0) >>> df.ix[:,'Capital'] #Select a single column of subset of columns
>>> df.drop('Country', axis=1) #Drop values from columns(axis=1) 0 Brussel
1 New Delhi
2 Brasíli
>>> df.ix[1,'Capital'] #Select rows and columns

> Asking For Help 'New Delhi'

Boolean Indexing
>>> help(pd.Series.loc) >>> s[~(s > 1)] #Series s where value is not >1
>>> s[(s < -1) | (s > 2)] #s where value is <-1 or >2
>>> df[df['Population']>1200000000] #Use filter to adjust DataFrame

> Sort & Rank Seting

>>> s['a'] = 6 #Set index a of Series s to 6

>>> df.sort_index() #Sort by labels along an axis Learn Data Skills Online at
>>> df.sort_values(by='Country') #Sort by the values along an axis
>>> df.rank() #Assign ranks to entries
www.DataCamp.com

Pandas - Cheat - Sheet (1) - 240511 - 113437
No ratings yet
Pandas - Cheat - Sheet (1) - 240511 - 113437
1 page
Pandas Basics Cheat Sheet Guide
No ratings yet
Pandas Basics Cheat Sheet Guide
1 page
Pandas Basics Cheat Sheet Guide
No ratings yet
Pandas Basics Cheat Sheet Guide
1 page
Mastering Pandas: A Comprehensive Guide
No ratings yet
Mastering Pandas: A Comprehensive Guide
13 pages
Pandas Cheet Sheet
No ratings yet
Pandas Cheet Sheet
1 page
Cheat Python
No ratings yet
Cheat Python
8 pages
Pandaspythonfordatascience
No ratings yet
Pandaspythonfordatascience
1 page
Pandas Cheat Sheet for Data Science
No ratings yet
Pandas Cheat Sheet for Data Science
1 page
Pandas Python For Data Science
100% (1)
Pandas Python For Data Science
1 page
Pandas Cheat Sheet for Data Science
No ratings yet
Pandas Cheat Sheet for Data Science
1 page
Python For Data Science 1662157639
No ratings yet
Python For Data Science 1662157639
6 pages
Pandas
No ratings yet
Pandas
13 pages
Pandas Notes
No ratings yet
Pandas Notes
20 pages
Pandas
No ratings yet
Pandas
26 pages
Data Handling Using Pandas-1
No ratings yet
Data Handling Using Pandas-1
60 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
16 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Lab-3 Pandas Library
No ratings yet
Lab-3 Pandas Library
14 pages
WEBINTEL GUIDED LAB ACTIVITY Introduction To Pandas
No ratings yet
WEBINTEL GUIDED LAB ACTIVITY Introduction To Pandas
1 page
Pandas Tutorial
No ratings yet
Pandas Tutorial
7 pages
Pandas Handbook
No ratings yet
Pandas Handbook
33 pages
Pandas Complete Notes
No ratings yet
Pandas Complete Notes
105 pages
Pandas DataFrame Cheat Sheet Guide
No ratings yet
Pandas DataFrame Cheat Sheet Guide
12 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
33 pages
Pandas Cheat Sheet
100% (1)
Pandas Cheat Sheet
2 pages
Python Cheat Sheet For Excel Users
100% (2)
Python Cheat Sheet For Excel Users
5 pages
Introduction to Pandas Basics
No ratings yet
Introduction to Pandas Basics
6 pages
Python For Data Science
No ratings yet
Python For Data Science
4 pages
Pandas DataFrame Notes
No ratings yet
Pandas DataFrame Notes
13 pages
Python Pandas Cheat Sheet Guide
No ratings yet
Python Pandas Cheat Sheet Guide
11 pages
Subject IP
No ratings yet
Subject IP
9 pages
Pandas Module Overview and Usage Guide
No ratings yet
Pandas Module Overview and Usage Guide
15 pages
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
100% (1)
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
12 pages
DevOps Session 3 Pandas
No ratings yet
DevOps Session 3 Pandas
33 pages
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
No ratings yet
Pandas Cheat Sheet Free Resources At: Dataquest - Io/guide
7 pages
Pandas
No ratings yet
Pandas
20 pages
Pandas
No ratings yet
Pandas
25 pages
Pandas
No ratings yet
Pandas
4 pages
Unit 3
No ratings yet
Unit 3
10 pages
Pandas
No ratings yet
Pandas
5 pages
Pandas Cheat Sheet for Data Science
No ratings yet
Pandas Cheat Sheet for Data Science
5 pages
Pandas Notes
No ratings yet
Pandas Notes
44 pages
Python Pandas Tutorial For Beginners
100% (1)
Python Pandas Tutorial For Beginners
203 pages
Pandas DataFrame Cheat Sheet
No ratings yet
Pandas DataFrame Cheat Sheet
4 pages
Pandas DataFrame Cheat Sheet
100% (1)
Pandas DataFrame Cheat Sheet
10 pages
Pandas DataFrame Basics Guide
No ratings yet
Pandas DataFrame Basics Guide
9 pages
Unit 4
No ratings yet
Unit 4
36 pages
Pandas
No ratings yet
Pandas
8 pages
Pandas Data Reshaping Cheat Sheet
No ratings yet
Pandas Data Reshaping Cheat Sheet
1 page
Pandas
No ratings yet
Pandas
21 pages
FOC Unit 3
No ratings yet
FOC Unit 3
11 pages
Ricoh MP 6503SP MP 7503SP MP 9003SP
No ratings yet
Ricoh MP 6503SP MP 7503SP MP 9003SP
6 pages
47 - 23@ Vocabspedia PSC
No ratings yet
47 - 23@ Vocabspedia PSC
25 pages
Soft Computing (SC) Topper Solution
100% (2)
Soft Computing (SC) Topper Solution
35 pages
OpcenterCNMOM ReleaseNotes 30RA1
No ratings yet
OpcenterCNMOM ReleaseNotes 30RA1
10 pages
Nema Receptacles Wiring Diagram
100% (1)
Nema Receptacles Wiring Diagram
5 pages
DLC Lab Report 7
No ratings yet
DLC Lab Report 7
17 pages
Example Rig Commissioning Plan
No ratings yet
Example Rig Commissioning Plan
19 pages
R08791 Modelingandsimulat Objec VE:: L TP C 3 3 To
No ratings yet
R08791 Modelingandsimulat Objec VE:: L TP C 3 3 To
1 page
Complete Mathematics For Programming & DSA - Ultimate Guide
No ratings yet
Complete Mathematics For Programming & DSA - Ultimate Guide
22 pages
EaseUS Product Overview
No ratings yet
EaseUS Product Overview
1 page
CS3_Backup_2025_08_05_14_48
No ratings yet
CS3_Backup_2025_08_05_14_48
24 pages
NM Lab Manual
No ratings yet
NM Lab Manual
7 pages
Kidus Yared
No ratings yet
Kidus Yared
5 pages
Java Backend Development Course Overview
0% (1)
Java Backend Development Course Overview
15 pages
Defibrilator Cardio-Aid® 360-B - ServiceManual
No ratings yet
Defibrilator Cardio-Aid® 360-B - ServiceManual
46 pages
Csat 2025 Quant Based Reasoning
No ratings yet
Csat 2025 Quant Based Reasoning
12 pages
Revit Drawing & Modify Tools Guide
No ratings yet
Revit Drawing & Modify Tools Guide
5 pages
Spruce Up Mobile Application
No ratings yet
Spruce Up Mobile Application
5 pages
Contract Management Procedure
No ratings yet
Contract Management Procedure
11 pages
Cs pb1 Ms
No ratings yet
Cs pb1 Ms
16 pages
International Case Study - Ebay
No ratings yet
International Case Study - Ebay
39 pages
ELC for Micro Hydro Power Plants
No ratings yet
ELC for Micro Hydro Power Plants
7 pages
HID Aero-X300-Controller-Ds-En
No ratings yet
HID Aero-X300-Controller-Ds-En
2 pages
IT Grade 7 Students Text Zero Draft S
No ratings yet
IT Grade 7 Students Text Zero Draft S
41 pages
Original Color Codes Vespa
No ratings yet
Original Color Codes Vespa
3 pages
STQA Case Study Group1
No ratings yet
STQA Case Study Group1
5 pages
Electrical Balance of Plant Solutions For Power Generation: Digital Energy
No ratings yet
Electrical Balance of Plant Solutions For Power Generation: Digital Energy
12 pages
Coding Olympiad Mock Exam
100% (1)
Coding Olympiad Mock Exam
22 pages
Assignment 1
No ratings yet
Assignment 1
3 pages

PandasGUIA PYTHON-04

Uploaded by

PandasGUIA PYTHON-04

Uploaded by

> I/O > Retrieving Series/DataFrame Information

Pandas Basics Cheat Sheet >>> pd.read_csv(‘file.csv’, header=None, nrows=5)

>>> df.ix[2] #Select single row of subset of rows

> Asking For Help 'New Delhi'

> Sort & Rank Seting

>>> s['a'] = 6 #Set index a of Series s to 6

You might also like