0% found this document useful (0 votes)

12 views2 pages

Data Analytics With Python Examples

The document provides a comprehensive guide on data analytics using Python, covering data gathering, cleaning, descriptive analytics, inferential statistics, and clustering. It includes code examples for loading datasets, handling missing values, performing statistical tests, and visualizing results. Key techniques demonstrated include t-tests for survival analysis and K-Means clustering for data segmentation.

Uploaded by

bibija.john

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

12 views2 pages

Data Analytics With Python Examples

Uploaded by

bibija.john

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Data Analytics with Python - Code and Visualization Examples

1. Data Gathering

import seaborn as sns

import pandas as pd

# Load sample dataset

df = sns.load_dataset("titanic")
print(df.head())

2. Data Scrubbing (Cleaning)

# Check for missing values

print(df.isnull().sum())

# Fill missing 'age' with median

df['age'].fillna(df['age'].median(), inplace=True)

# Drop 'deck' column (too many missing values)

df.drop(columns=['deck'], inplace=True)

# Drop rows with any remaining nulls

df.dropna(inplace=True)

3. Descriptive Analytics

# Descriptive statistics
print(df.describe())

# Plot: Age distribution

import matplotlib.pyplot as plt
import seaborn as sns

sns.histplot(df['age'], bins=30, kde=True)

plt.title('Age Distribution')
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.show()

4. Measures of Central Tendency and Spread

mean_age = df['age'].mean()
median_age = df['age'].median()
std_dev = df['age'].std()

print(f"Mean Age: {mean_age:.2f}")

print(f"Median Age: {median_age}")
print(f"Standard Deviation: {std_dev:.2f}")
Data Analytics with Python - Code and Visualization Examples

5. Inferential Statistics: T-Test

from scipy.stats import ttest_ind

# Create two groups

survived = df[df['survived'] == 1]['age']
not_survived = df[df['survived'] == 0]['age']

# Perform independent t-test

t_stat, p_val = ttest_ind(survived, not_survived)

print(f"T-statistic: {t_stat:.2f}")
print(f"P-value: {p_val:.4f}")

6. Data Analysis: Survival Rate by Sex

sns.barplot(x='sex', y='survived', data=df)

plt.title('Survival Rate by Sex')
plt.ylabel('Survival Rate')
plt.show()

7. Clustering with K-Means

from sklearn.cluster import KMeans

# Select numeric features

X = df[['age', 'fare']]

# Apply K-Means Clustering

kmeans = KMeans(n_clusters=3)
df['cluster'] = kmeans.fit_predict(X)

# Plot clusters
plt.figure(figsize=(8,5))
sns.scatterplot(x='age', y='fare', hue='cluster', data=df, palette='Set2')
plt.title('K-Means Clustering on Age and Fare')
plt.show()

Course - Introduction To Data Science (SD211105)
No ratings yet
Course - Introduction To Data Science (SD211105)
10 pages
Pandas Complete + Visualisation Summary of IBM Visualization
No ratings yet
Pandas Complete + Visualisation Summary of IBM Visualization
21 pages
Summary: Introduction To Data Visualization Tools
No ratings yet
Summary: Introduction To Data Visualization Tools
13 pages
Air Quality Data Analysis Process
No ratings yet
Air Quality Data Analysis Process
8 pages
Introduction to Pandas DataFrames
No ratings yet
Introduction to Pandas DataFrames
25 pages
DVA Practical
No ratings yet
DVA Practical
19 pages
BasicAnalysis Using PYTHON
No ratings yet
BasicAnalysis Using PYTHON
6 pages
Data Analytics
No ratings yet
Data Analytics
34 pages
Data Science
No ratings yet
Data Science
6 pages
Data Analysis & Visualization Guide
No ratings yet
Data Analysis & Visualization Guide
9 pages
Wa0005.
No ratings yet
Wa0005.
29 pages
Exploratory Data Analysis
No ratings yet
Exploratory Data Analysis
4 pages
Data Analysis With Python
100% (1)
Data Analysis With Python
29 pages
Credit Card Customer Retention Analysis
No ratings yet
Credit Card Customer Retention Analysis
51 pages
Python Ds
No ratings yet
Python Ds
22 pages
BDA File
No ratings yet
BDA File
26 pages
EDA with Python: Techniques & Tools
No ratings yet
EDA with Python: Techniques & Tools
47 pages
Python For Data Analysis Jan 28
No ratings yet
Python For Data Analysis Jan 28
105 pages
Beginner's Guide To Python For Data Science Rodriguez Special
No ratings yet
Beginner's Guide To Python For Data Science Rodriguez Special
7 pages
Data Visualization with Python Tutorial
100% (1)
Data Visualization with Python Tutorial
9 pages
MODULE2 Material
No ratings yet
MODULE2 Material
14 pages
Pandas & PyNumS Essentials
No ratings yet
Pandas & PyNumS Essentials
10 pages
DAV EXP 1 t12 31
No ratings yet
DAV EXP 1 t12 31
39 pages
24UAD315 DEV Final Record
No ratings yet
24UAD315 DEV Final Record
49 pages
Data Prep & EDA for Python Users
No ratings yet
Data Prep & EDA for Python Users
12 pages
Chapter 2. Data Analysis and Processing - Full
No ratings yet
Chapter 2. Data Analysis and Processing - Full
49 pages
Module 1.foundations of Data Science
No ratings yet
Module 1.foundations of Data Science
17 pages
Data Analysis
No ratings yet
Data Analysis
4 pages
Types of Data Analysis With Code
No ratings yet
Types of Data Analysis With Code
8 pages
It Journal
No ratings yet
It Journal
30 pages
Deep Python For Data Analysis
No ratings yet
Deep Python For Data Analysis
4 pages
Pandas
No ratings yet
Pandas
7 pages
Server Hosting Management System (Ip Class 12) (2024-25)
No ratings yet
Server Hosting Management System (Ip Class 12) (2024-25)
21 pages
Advanced Python & Data Science Guide
No ratings yet
Advanced Python & Data Science Guide
42 pages
Training Report On Data Analysis With Python
No ratings yet
Training Report On Data Analysis With Python
12 pages
Code Shabab Error 7
No ratings yet
Code Shabab Error 7
5 pages
Final Dev Record
No ratings yet
Final Dev Record
49 pages
Lab Record Dev
No ratings yet
Lab Record Dev
20 pages
Data Analytics by Using Python 2025-09-13
No ratings yet
Data Analytics by Using Python 2025-09-13
2 pages
Data Exploration and Visualization Laboratory - AD3301 - Lab Manual
No ratings yet
Data Exploration and Visualization Laboratory - AD3301 - Lab Manual
55 pages
Data Visualization
No ratings yet
Data Visualization
23 pages
PDS - Chapter 4
No ratings yet
PDS - Chapter 4
25 pages
Data Visualisation
No ratings yet
Data Visualisation
5 pages
CG DADL - 2024 June - Lecture 02
No ratings yet
CG DADL - 2024 June - Lecture 02
64 pages
Python & MySQL For Data Analysis
No ratings yet
Python & MySQL For Data Analysis
45 pages
Data Analysis - 5th Unit
No ratings yet
Data Analysis - 5th Unit
14 pages
CSE445 NSU Week - 3
No ratings yet
CSE445 NSU Week - 3
48 pages
Financial Analytics With Python
100% (1)
Financial Analytics With Python
40 pages
Viva Answers
No ratings yet
Viva Answers
3 pages
Data Visualization
No ratings yet
Data Visualization
10 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Advanced Visualization For Data Scientists With Matplotlib
No ratings yet
Advanced Visualization For Data Scientists With Matplotlib
38 pages
FOUND. DATA SCIENCE Practical
No ratings yet
FOUND. DATA SCIENCE Practical
15 pages
Data Analysis
No ratings yet
Data Analysis
42 pages
Data Analysis Guide for Beginners
No ratings yet
Data Analysis Guide for Beginners
26 pages
Exploratory Data Analysis-1
No ratings yet
Exploratory Data Analysis-1
10 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
Practical No.-01
No ratings yet
Practical No.-01
25 pages
Fraud 2
No ratings yet
Fraud 2
20 pages

Data Analytics With Python Examples

Uploaded by

Data Analytics With Python Examples

Uploaded by

Data Analytics with Python - Code and Visualization Examples

import seaborn as sns

# Load sample dataset

2. Data Scrubbing (Cleaning)

# Check for missing values

# Fill missing 'age' with median

# Drop 'deck' column (too many missing values)

# Drop rows with any remaining nulls

# Plot: Age distribution

sns.histplot(df['age'], bins=30, kde=True)

4. Measures of Central Tendency and Spread

print(f"Mean Age: {mean_age:.2f}")

5. Inferential Statistics: T-Test

from scipy.stats import ttest_ind

# Create two groups

# Perform independent t-test

6. Data Analysis: Survival Rate by Sex

sns.barplot(x='sex', y='survived', data=df)

7. Clustering with K-Means

from sklearn.cluster import KMeans

# Select numeric features

# Apply K-Means Clustering

You might also like