Pandas Notes

This document provides notes on data handling and analysis using Pandas, covering key operations such as reading, cleaning, filtering, analyzing, grouping, merging, and exporting data. It includes code examples for each operation, demonstrating how to manipulate DataFrames effectively. The notes serve as a quick reference guide for performing common data tasks in Python with Pandas.

Uploaded by

mehul garje

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

426 views2 pages

Pandas Notes

Uploaded by

mehul garje

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Pandas Notes - Data Handling & Analysis

Reading Data

- Use `pd.read_csv('file.csv')` to read CSV files.

- Use `pd.read_excel('file.xlsx')` to read Excel files.
- Use `df.head()` to view the first 5 rows.
- Use `df.tail()` to view the last 5 rows.
- Use `df.info()` to see data types and non-null counts.
Example:
df = pd.read_csv('data.csv')

Cleaning Data

- Use `df.isnull().sum()` to check missing values.

- Fill missing data: `df.fillna(value)`.
- Drop missing rows: `df.dropna()`.
- Rename columns: `df.rename(columns={'old':'new'})`.
Example:
df['age'].fillna(df['age'].mean(), inplace=True)

Filtering Data

- Single condition: `df[df['age'] > 30]`

- Multiple conditions: `df[(df['age'] > 25) & (df['marks'] > 80)]`
- Equality: `df[df['name'] == 'Bob']`
- `isin()`: `df[df['name'].isin(['Alice', 'David'])]`
- String match: `df[df['name'].str.startswith('A')]`
Example:
df.query('age > 30 and marks < 90')

Analyzing Data

- `df.describe()` gives statistical summary.

- Column stats: `mean()`, `max()`, `min()`, `mode()`.
- `value_counts()` for frequency count.
- `df.groupby('col')['val'].mean()` for grouped mean.
- `df.corr()` for correlation.
Example:
df.groupby('department')['marks'].agg(['min', 'max', 'mean'])

Grouping Data

- Use `groupby()` to group and aggregate.

- Average marks: `df.groupby('department')['marks'].mean()`
- Multiple stats: `agg(['min', 'max'])`
- Group by multiple: `df.groupby(['dept', 'name'])`
Pandas Notes - Data Handling & Analysis
- Reset index: `reset_index()` to flatten result.
Example:
df.groupby('department')['marks'].sum().reset_index()

Merging Data

- `pd.merge(df1, df2, on='id')` for inner join.

- `how='left'`, `'right'`, `'outer'` for other joins.
- Merge on multiple keys: `on=['id', 'name']`.
Example:
pd.merge(students, marks, on='id', how='left')

Exporting Data

- To CSV: `df.to_csv('file.csv', index=False)`

- To Excel: `df.to_excel('file.xlsx', index=False)`
- To JSON: `df.to_json('file.json')`
Example:
df.to_csv('cleaned_data.csv', index=False)

Pandas Presentation
No ratings yet
Pandas Presentation
10 pages
Pandas Handbook
No ratings yet
Pandas Handbook
33 pages
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
No ratings yet
Exploratory Data Analysis (Eda) With Pandas: (Cheatsheet)
7 pages
Using Pandas for Data Analysis in Python
No ratings yet
Using Pandas for Data Analysis in Python
8 pages
Python Pandas DataFrame Guide
No ratings yet
Python Pandas DataFrame Guide
53 pages
Unit-1 Python Pandas
No ratings yet
Unit-1 Python Pandas
56 pages
Chapter - 6 Dictionary
100% (2)
Chapter - 6 Dictionary
25 pages
Ipl Data Anlysis
No ratings yet
Ipl Data Anlysis
20 pages
Data Handing Using Pandas-I
100% (2)
Data Handing Using Pandas-I
46 pages
Block 1-Data Handling Using Pandas DataFrame
No ratings yet
Block 1-Data Handling Using Pandas DataFrame
17 pages
Pandas Notes Basic To Advance
No ratings yet
Pandas Notes Basic To Advance
21 pages
Data Manipulation With Pandas
No ratings yet
Data Manipulation With Pandas
19 pages
Pandas
No ratings yet
Pandas
41 pages
Pandas
No ratings yet
Pandas
8 pages
Python Pandas
No ratings yet
Python Pandas
177 pages
Pandas
No ratings yet
Pandas
14 pages
XII-IP-QuickRevision 2 in 1
No ratings yet
XII-IP-QuickRevision 2 in 1
13 pages
Python Data Analysis Basics
100% (1)
Python Data Analysis Basics
246 pages
Pandas Cheat Sheet for Data Science
No ratings yet
Pandas Cheat Sheet for Data Science
5 pages
Class 12 IP Ch-1, 2 3
No ratings yet
Class 12 IP Ch-1, 2 3
28 pages
Interview Bit Pandas
No ratings yet
Interview Bit Pandas
62 pages
Notes File Handling Term1 2022-23
No ratings yet
Notes File Handling Term1 2022-23
25 pages
Python Practical No.3 While Loop Programs
No ratings yet
Python Practical No.3 While Loop Programs
7 pages
Pandas DataFrame Basics
No ratings yet
Pandas DataFrame Basics
48 pages
SQL Query Structure Overview
No ratings yet
SQL Query Structure Overview
112 pages
Pandas DataFrame Basics Guide
No ratings yet
Pandas DataFrame Basics Guide
4 pages
Dictionary in Python
No ratings yet
Dictionary in Python
21 pages
ML Lab1 Python Panda
No ratings yet
ML Lab1 Python Panda
9 pages
Data Handling Python NCERT
No ratings yet
Data Handling Python NCERT
36 pages
International Indian School, Riyadh WORKSHEET (2020-2021) Grade - Xii - Informatics Practices - Second Term
No ratings yet
International Indian School, Riyadh WORKSHEET (2020-2021) Grade - Xii - Informatics Practices - Second Term
9 pages
Python Pandas for Data Analysts
No ratings yet
Python Pandas for Data Analysts
12 pages
Pandas 6 1716219621
No ratings yet
Pandas 6 1716219621
17 pages
Pandas
No ratings yet
Pandas
30 pages
Introduction to Pandas DataFrames
100% (1)
Introduction to Pandas DataFrames
21 pages
Python 2.1.3
No ratings yet
Python 2.1.3
6 pages
Pandas Course Slides
No ratings yet
Pandas Course Slides
90 pages
Employee Data Analysis System (Ip Class 12) (2024-25)
No ratings yet
Employee Data Analysis System (Ip Class 12) (2024-25)
30 pages
Python Pandas Tutorial - The Ultimate Guide For Beginner
No ratings yet
Python Pandas Tutorial - The Ultimate Guide For Beginner
32 pages
Class XII Pandas & SQL Practical List
100% (1)
Class XII Pandas & SQL Practical List
7 pages
Pandas
No ratings yet
Pandas
27 pages
Data Handling Using Pandas-1
100% (1)
Data Handling Using Pandas-1
25 pages
Data Analysis With Pandas - Aggregates in Pandas Cheatsheet - Codecademy
100% (1)
Data Analysis With Pandas - Aggregates in Pandas Cheatsheet - Codecademy
2 pages
Top 50 Pandas Interview Questions and Answers (2024)
No ratings yet
Top 50 Pandas Interview Questions and Answers (2024)
34 pages
Pandas Methods
No ratings yet
Pandas Methods
6 pages
18 Pandas
No ratings yet
18 Pandas
33 pages
Student Sales Management Project
No ratings yet
Student Sales Management Project
23 pages
Class XII Python Pandas Study Material
No ratings yet
Class XII Python Pandas Study Material
180 pages
Unit - 1 - Python Pandas
No ratings yet
Unit - 1 - Python Pandas
176 pages
EDA With Pandas CheatSheet
No ratings yet
EDA With Pandas CheatSheet
3 pages
Stellar Classification Analysis Report
No ratings yet
Stellar Classification Analysis Report
18 pages
Saish IP Project
No ratings yet
Saish IP Project
16 pages
SQL Database Notes
No ratings yet
SQL Database Notes
8 pages
Pandas Data Manipulation Extended CheatSheet 1731972219
No ratings yet
Pandas Data Manipulation Extended CheatSheet 1731972219
9 pages
Pandas Notes
No ratings yet
Pandas Notes
6 pages
XII-IP - Data Visualisation
No ratings yet
XII-IP - Data Visualisation
65 pages
Pandas Guide for Data Analysts
No ratings yet
Pandas Guide for Data Analysts
9 pages
Database Management System
No ratings yet
Database Management System
35 pages
Informatics Practices Class 12 Study Material
No ratings yet
Informatics Practices Class 12 Study Material
128 pages
Universal Data Analytics Algorithm
No ratings yet
Universal Data Analytics Algorithm
51 pages
EDA Cheat Sheet
No ratings yet
EDA Cheat Sheet
7 pages

Pandas Notes

Uploaded by

Pandas Notes

Uploaded by

Pandas Notes - Data Handling & Analysis

- Use `pd.read_csv('file.csv')` to read CSV files.

- Use `df.isnull().sum()` to check missing values.

- Single condition: `df[df['age'] > 30]`

- `df.describe()` gives statistical summary.

- Use `groupby()` to group and aggregate.

- `pd.merge(df1, df2, on='id')` for inner join.

- To CSV: `df.to_csv('file.csv', index=False)`

You might also like