0% found this document useful (0 votes)

15 views8 pages

Statistics Practice Guide

Uploaded by

katasanipandu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views8 pages

Statistics Practice Guide

Uploaded by

katasanipandu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 8

Comprehensive Practice Guide for Revising

Statistics and Implementation in Python

Day 1: Descriptive Statistics
Theory:
 Topics to Revise:
o Mean, Median, Mode
o Variance, Standard Deviation
o Range, Quartiles, Percentiles
o Skewness and Kurtosis

Python Practice:
1. Calculating Descriptive Statistics:

import numpy as np
import scipy.stats as stats

data = [15, 20, 35, 40, 50]

print("Mean:", np.mean(data))
print("Median:", np.median(data))
print("Mode:", stats.mode(data))
print("Variance:", np.var(data))
print("Standard Deviation:", np.std(data))

2. Box Plot and Quartiles:

import matplotlib.pyplot as plt

plt.boxplot(data)
plt.title("Box Plot")
plt.show()

Day 2: Probability
Theory:
 Topics to Revise:
o Basic Probability Rules
o Conditional Probability
o Bayes’ Theorem
o Random Variables
Python Practice:
1. Simulating Coin Tosses:

import random

results = [random.choice(["Heads", "Tails"]) for _ in

range(1000)]
print("Heads:", results.count("Heads"))
print("Tails:", results.count("Tails"))

2. Conditional Probability Using Pandas:

import pandas as pd

data = pd.DataFrame({
"Event": ["A", "A", "B", "B"],
"Condition": ["X", "Y", "X", "Y"],
"Frequency": [30, 20, 50, 10]
})

prob_a_given_x = data[(data["Event"] == "A") & (data["Condition"]

== "X")]["Frequency"].sum() / data[data["Condition"] == "X"]
["Frequency"].sum()
print("P(A|X):", prob_a_given_x)

Day 3: Probability Distributions

Theory:
 Topics to Revise:
o Binomial Distribution
o Normal Distribution
o Poisson Distribution

Python Practice:
1. Binomial Distribution:

from scipy.stats import binom

n, p = 10, 0.5
k = 5
print("P(X=5):", binom.pmf(k, n, p))

2. Normal Distribution Visualization:

import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(-3, 3, 100)
y = stats.norm.pdf(x, loc=0, scale=1)
plt.plot(x, y)
plt.title("Normal Distribution")
plt.show()

Day 4: Hypothesis Testing

Theory:
 Topics to Revise:
o Null and Alternative Hypotheses
o Types of Errors (Type I and II)
o p-value
o t-test, z-test, ANOVA

Python Practice:
1. t-test:

from scipy.stats import ttest_ind

group1 = [20, 21, 19, 22, 20]

group2 = [30, 31, 29, 32, 30]
t_stat, p_val = ttest_ind(group1, group2)
print("t-statistic:", t_stat, "p-value:", p_val)

2. ANOVA:

from scipy.stats import f_oneway

group1 = [20, 21, 19, 22, 20]

group2 = [30, 31, 29, 32, 30]
group3 = [25, 26, 24, 27, 25]
f_stat, p_val = f_oneway(group1, group2, group3)
print("F-statistic:", f_stat, "p-value:", p_val)

Day 5: Regression Analysis

Theory:
 Topics to Revise:
o Linear Regression
o Multiple Linear Regression
o Assumptions of Regression
Python Practice:
1. Simple Linear Regression:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

x = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)
y = np.array([2, 4, 5, 4, 5])

model = LinearRegression()
model.fit(x, y)
plt.scatter(x, y, color='blue')
plt.plot(x, model.predict(x), color='red')
plt.title("Linear Regression")
plt.show()

2. Multiple Linear Regression:

from sklearn.linear_model import LinearRegression

import pandas as pd

data = pd.DataFrame({
"X1": [1, 2, 3, 4, 5],
"X2": [5, 4, 3, 2, 1],
"Y": [2, 4, 5, 4, 5]
})

X = data[["X1", "X2"]]
y = data["Y"]
model = LinearRegression()
model.fit(X, y)
print("Coefficients:", model.coef_)

Day 6: Clustering and Visualization

Theory:
 Topics to Revise:
o k-Means Clustering
o Hierarchical Clustering

Python Practice:
1. k-Means Clustering:

from sklearn.cluster import KMeans

import numpy as np
import matplotlib.pyplot as plt

data = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10,
0]])
kmeans = KMeans(n_clusters=2, random_state=0).fit(data)

plt.scatter(data[:, 0], data[:, 1], c=kmeans.labels_)

plt.scatter(kmeans.cluster_centers_[:, 0],
kmeans.cluster_centers_[:, 1], s=200, c='red', marker='X')
plt.title("k-Means Clustering")
plt.show()

2. Hierarchical Clustering:

from scipy.cluster.hierarchy import dendrogram, linkage

import numpy as np
import matplotlib.pyplot as plt

data = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10,
0]])
linked = linkage(data, method='ward')

dendrogram(linked)
plt.title("Hierarchical Clustering")
plt.show()

Day 7: Time Series Analysis

Theory:
 Topics to Revise:
o Moving Averages
o ARIMA Model

Python Practice:
1. Simple Moving Average:

import pandas as pd
data = pd.Series([1, 2, 3, 4, 5, 6, 7])
print(data.rolling(window=3).mean())

2. ARIMA Model:

from statsmodels.tsa.arima.model import ARIMA

series = [1, 2, 3, 4, 5, 6, 7]
model = ARIMA(series, order=(1, 0, 0))
model_fit = model.fit()
print(model_fit.summary())

Day 8: Data Visualization Techniques

Theory:
 Topics to Revise:
o Effective Chart Selection
o Misleading Visualizations

Python Practice:
1. Comparative Bar Chart:

import matplotlib.pyplot as plt

categories = ["A", "B", "C"]

values1 = [3, 7, 8]
values2 = [2, 6, 9]

x = range(len(categories))
plt.bar(x, values1, width=0.4, label='Group 1', align='center')
plt.bar(x, values2, width=0.4, label='Group 2', align='edge')
plt.xticks(x, categories)
plt.legend()
plt.show()

2. Heatmap with Seaborn:

import seaborn as sns

import numpy as np
import matplotlib.pyplot as plt

data = np.random.rand(10, 10)

sns.heatmap(data, annot=True, cmap="coolwarm")
plt.show()

Day 9: Advanced Probability Models

Theory:
 Topics to Revise:
o Markov Chains
o Hidden Markov Models
Python Practice:
1. Markov Chain Transition Matrix:

import numpy as np

P = np.array([[0.7, 0.3], [0.4, 0.6]])

state = np.array([1, 0])
print("Next State:", np.dot(state, P))

2. HMM with hmmlearn:

from hmmlearn import hmm

import numpy as np

model = hmm.GaussianHMM(n_components=2, covariance_type="diag")

data = np.random.rand(100, 1)
model.fit(data)
print("Transition Matrix:", model.transmat_)

Day 10: Optimization Techniques

Theory:
 Topics to Revise:
o Linear Programming
o Gradient Descent

Python Practice:
1. Linear Programming:

from scipy.optimize import linprog

c = [-1, -2]
A = [[2, 1], [1, 1]]
b = [20, 16]
bounds = [(0, None), (0, None)]

res = linprog(c, A_ub=A, b_ub=b, bounds=bounds, method='highs')

print("Optimal Solution:", res.x)

2. Gradient Descent:

import numpy as np

def gradient_descent(x0, lr, num_iter):

x = x0
for _ in range(num_iter):
grad = 2 * x
x -= lr * grad
return x

print("Minimum Point:", gradient_descent(10, 0.1, 100))

Python Programs for Data Analysis and Visualization
No ratings yet
Python Programs for Data Analysis and Visualization
15 pages
Probability and Statistics Course
No ratings yet
Probability and Statistics Course
5 pages
R Programming Practical Exercises
No ratings yet
R Programming Practical Exercises
13 pages
Python & R Statistics Guide
No ratings yet
Python & R Statistics Guide
12 pages
ML (Sudhanshu)
No ratings yet
ML (Sudhanshu)
24 pages
1152CS239-Intro. To Data Science-Syllabus
No ratings yet
1152CS239-Intro. To Data Science-Syllabus
6 pages
AI Lab Codes.
No ratings yet
AI Lab Codes.
12 pages
Syllabus AIML
No ratings yet
Syllabus AIML
14 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
34 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
38 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Fdsa Record Ai&Ds
No ratings yet
Fdsa Record Ai&Ds
26 pages
45 Day Statistics Python Study Plan GenAI
No ratings yet
45 Day Statistics Python Study Plan GenAI
3 pages
4 12
No ratings yet
4 12
17 pages
Probability Regression Roadmap
No ratings yet
Probability Regression Roadmap
8 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Unit 1 - Week (1 - 4) : Planning and Thinking Skills For Architecting Data Science Solutions
No ratings yet
Unit 1 - Week (1 - 4) : Planning and Thinking Skills For Architecting Data Science Solutions
3 pages
Function Operations (Algebra) : Concept
No ratings yet
Function Operations (Algebra) : Concept
4 pages
Omkar
No ratings yet
Omkar
37 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
Final Notes
No ratings yet
Final Notes
3 pages
Data Science Content
No ratings yet
Data Science Content
11 pages
Stat Lab
No ratings yet
Stat Lab
24 pages
Python Statistical Modeling Lab
No ratings yet
Python Statistical Modeling Lab
33 pages
Edaunit IV
No ratings yet
Edaunit IV
15 pages
Fha-Pyhton Program Unit 1-4
No ratings yet
Fha-Pyhton Program Unit 1-4
13 pages
DSF Lab
No ratings yet
DSF Lab
14 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Stats Lab (4-6)
No ratings yet
Stats Lab (4-6)
7 pages
Gec Practicals
No ratings yet
Gec Practicals
31 pages
Python Programming Course Outline
No ratings yet
Python Programming Course Outline
1 page
Pds Record Document Ds II
No ratings yet
Pds Record Document Ds II
36 pages
ML Engineer 12 Week Roadmap
No ratings yet
ML Engineer 12 Week Roadmap
12 pages
DS g4g
No ratings yet
DS g4g
7 pages
Python Basics and ML Overview
No ratings yet
Python Basics and ML Overview
9 pages
Statistical Functions in Python
No ratings yet
Statistical Functions in Python
31 pages
Python Data Science Essentials
No ratings yet
Python Data Science Essentials
11 pages
External
No ratings yet
External
11 pages
Data Mining Internship Report
No ratings yet
Data Mining Internship Report
3 pages
Probability Distributions and MLE Analysis
No ratings yet
Probability Distributions and MLE Analysis
11 pages
Index: SR. NO. Practical Name Date of Perform NO. Sign
No ratings yet
Index: SR. NO. Practical Name Date of Perform NO. Sign
28 pages
Data Science Notes
No ratings yet
Data Science Notes
5 pages
Dhrumil Aml
No ratings yet
Dhrumil Aml
14 pages
ML Record
No ratings yet
ML Record
19 pages
Artificial Intelligence Lab
No ratings yet
Artificial Intelligence Lab
13 pages
Data Analysis and Visualization Course
No ratings yet
Data Analysis and Visualization Course
4 pages
Ad3411-Data Science and Analytics Laboratory
No ratings yet
Ad3411-Data Science and Analytics Laboratory
27 pages
Data Science New Report
No ratings yet
Data Science New Report
39 pages
Data Handling in Data Science
No ratings yet
Data Handling in Data Science
76 pages
Data Science for Engineers Course
No ratings yet
Data Science for Engineers Course
8 pages
Python Code for Central Tendency
No ratings yet
Python Code for Central Tendency
28 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
Python Lab PRG
No ratings yet
Python Lab PRG
20 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Topic Wise Dsa Questions
No ratings yet
Topic Wise Dsa Questions
15 pages
Oil Recommendations
No ratings yet
Oil Recommendations
4 pages
Review of Robin Sharma's 5 AM Club
No ratings yet
Review of Robin Sharma's 5 AM Club
9 pages
Research Methods for Learners
100% (1)
Research Methods for Learners
73 pages
Preface
No ratings yet
Preface
7 pages
STEP by STEP (Master Data Loading)
No ratings yet
STEP by STEP (Master Data Loading)
12 pages
Eldro Thruster Installation Manual
No ratings yet
Eldro Thruster Installation Manual
5 pages
MBA Dissertation Proposal Guide
100% (2)
MBA Dissertation Proposal Guide
6 pages
4701-0056-01A SSI-8000 BASIC Operator's Manual
No ratings yet
4701-0056-01A SSI-8000 BASIC Operator's Manual
183 pages
The Making of A Hotwife: The Next Morning
No ratings yet
The Making of A Hotwife: The Next Morning
36 pages
Utilization of 20% Barangay Development Fund
70% (10)
Utilization of 20% Barangay Development Fund
17 pages
SS1 1ST Term Civic Educ
No ratings yet
SS1 1ST Term Civic Educ
34 pages
Limit States Method (Cec402 Assignment of Group3a)
No ratings yet
Limit States Method (Cec402 Assignment of Group3a)
50 pages
Bilge System
No ratings yet
Bilge System
11 pages
Assembly Language Reference PDF
No ratings yet
Assembly Language Reference PDF
366 pages
AI Community - Welcome Instructions - Workzone
No ratings yet
AI Community - Welcome Instructions - Workzone
14 pages
My Action Plan02023
No ratings yet
My Action Plan02023
3 pages
Using COMSOL-Multiphysics in An Eddy Current
No ratings yet
Using COMSOL-Multiphysics in An Eddy Current
5 pages
WFH Excuses - The Ultimate Guide To Remote Work Alibis
No ratings yet
WFH Excuses - The Ultimate Guide To Remote Work Alibis
14 pages
English Curriculum Plan 2018-2019
No ratings yet
English Curriculum Plan 2018-2019
4 pages
Pcss Eye Schedule s3
No ratings yet
Pcss Eye Schedule s3
6 pages
Authoritative Parenting's Impact on Behavior
No ratings yet
Authoritative Parenting's Impact on Behavior
22 pages
International Business Management Assignment
No ratings yet
International Business Management Assignment
1 page
WISC V Intermediate
No ratings yet
WISC V Intermediate
38 pages
Derivatives
No ratings yet
Derivatives
2 pages
Connections I V2.1.0.a1
100% (1)
Connections I V2.1.0.a1
49 pages
Specifications: Limitorque MX and L120 Series Product Specifications
No ratings yet
Specifications: Limitorque MX and L120 Series Product Specifications
42 pages
Energy Resource and Management
No ratings yet
Energy Resource and Management
43 pages
Biology 2A03 Course Outline Winter 2010
No ratings yet
Biology 2A03 Course Outline Winter 2010
4 pages
Asatt 16
No ratings yet
Asatt 16
3 pages
Engine Starting Systems
0% (1)
Engine Starting Systems
19 pages

Statistics Practice Guide

Uploaded by

Statistics Practice Guide

Uploaded by

Comprehensive Practice Guide for Revising

Statistics and Implementation in Python

data = [15, 20, 35, 40, 50]

2. Box Plot and Quartiles:

import matplotlib.pyplot as plt

results = [random.choice(["Heads", "Tails"]) for _ in

2. Conditional Probability Using Pandas:

prob_a_given_x = data[(data["Event"] == "A") & (data["Condition"]

Day 3: Probability Distributions

from scipy.stats import binom

2. Normal Distribution Visualization:

Day 4: Hypothesis Testing

from scipy.stats import ttest_ind

group1 = [20, 21, 19, 22, 20]

from scipy.stats import f_oneway

group1 = [20, 21, 19, 22, 20]

Day 5: Regression Analysis

2. Multiple Linear Regression:

from sklearn.linear_model import LinearRegression

Day 6: Clustering and Visualization

from sklearn.cluster import KMeans

plt.scatter(data[:, 0], data[:, 1], c=kmeans.labels_)

from scipy.cluster.hierarchy import dendrogram, linkage

Day 7: Time Series Analysis

from statsmodels.tsa.arima.model import ARIMA

Day 8: Data Visualization Techniques

import matplotlib.pyplot as plt

categories = ["A", "B", "C"]

2. Heatmap with Seaborn:

import seaborn as sns

data = np.random.rand(10, 10)

Day 9: Advanced Probability Models

P = np.array([[0.7, 0.3], [0.4, 0.6]])

2. HMM with hmmlearn:

from hmmlearn import hmm

model = hmm.GaussianHMM(n_components=2, covariance_type="diag")

Day 10: Optimization Techniques

from scipy.optimize import linprog

res = linprog(c, A_ub=A, b_ub=b, bounds=bounds, method='highs')

def gradient_descent(x0, lr, num_iter):

print("Minimum Point:", gradient_descent(10, 0.1, 100))

You might also like