Statistical Analysis For Data Science

Statistical analysis is essential in data science for discovering patterns and making predictions from data. It includes descriptive statistics, which summarize datasets through measures of central tendency and dispersion, and inferential statistics, which use sample data to draw conclusions about larger populations. Key concepts include hypothesis testing, common statistical tests, and probability distributions.

Uploaded by

Shubham Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views2 pages

Statistical Analysis For Data Science

Uploaded by

Shubham Gupta

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Statistical Analysis for Data Science

Statistical analysis is a fundamental component of data science that involves collecting,
exploring, and presenting large amounts of data to discover underlying patterns and trends. It
provides the mathematical foundation for making informed decisions and predictions based on
data.

Descriptive Statistics
Descriptive statistics summarize and quantify the main features of a dataset.

Measures of Central Tendency

Mean: The average of all values in a dataset.

Median: The middle value when data is arranged in order.

Mode: The most frequently occurring value in a dataset.

Measures of Dispersion
Range: The difference between the maximum and minimum values.

Variance: The average squared deviation from the mean.

Standard Deviation: The square root of the variance.

Interquartile Range (IQR): The range between the first and third quartiles.

import numpy as np
from scipy import stats

# Sample dataset
data = [12, 15, 17, 19, 20, 22, 25, 25, 27, 28, 30, 32, 35, 37, 40, 42, 45]

# Measures of central tendency

mean = np.mean(data)
median = np.median(data)
mode = stats.mode(data).mode[0]

# Measures of dispersion
data_range = np.max(data) - np.min(data)
variance = np.var(data)

Statistical Analysis for Data Science 1

std_dev = np.std(data)
q75, q25 = np.percentile(data, [75, 25])
iqr = q75 - q25

print(f"Mean: {mean}")
print(f"Median: {median}")
print(f"Mode: {mode}")
print(f"Range: {data_range}")
print(f"Variance: {variance}")
print(f"Standard Deviation: {std_dev}")
print(f"Interquartile Range: {iqr}")

Inferential Statistics
Inferential statistics use sample data to make inferences about a larger population.

Hypothesis Testing
The process of making statistical decisions based on experimental data.

Null Hypothesis (H₀): A statement that there is no effect or difference.

Alternative Hypothesis (H₁): A statement that contradicts the null hypothesis.

p-value: The probability of obtaining results as extreme as the observed results, assuming
the null hypothesis is true.

Significance Level (α): The threshold below which the null hypothesis is rejected.

Common Statistical Tests

Test Use Case Example

Comparing treatment vs. control

t-test Compare means of two groups
group

Comparing multiple treatment

ANOVA Compare means of three or more groups
options

Chi-square Test relationships between categorical variables Analyzing survey responses

Correlation Measure relationship between two variables Height vs. weight analysis

Predict a dependent variable based on independent

Regression Predicting house prices
variables

Probability Distributions
Probability distributions describe the likelihood of different outcomes in an experiment.

Statistical Analysis for Data Science 2

EDA: Key Stats & Visualizations in Python
No ratings yet
EDA: Key Stats & Visualizations in Python
15 pages
Comprehensive Ebook of Statistics For Data Science - Chaitali
No ratings yet
Comprehensive Ebook of Statistics For Data Science - Chaitali
21 pages
DS Chapter - 2
No ratings yet
DS Chapter - 2
73 pages
02 Exploratory Data Analytics
No ratings yet
02 Exploratory Data Analytics
41 pages
Math
No ratings yet
Math
50 pages
2.DescriptiveAnalytics v2
No ratings yet
2.DescriptiveAnalytics v2
10 pages
Week - 1 Day - 1 Descriptive Statistics
No ratings yet
Week - 1 Day - 1 Descriptive Statistics
40 pages
Chapter 2 BSC TY Statistical Data Analysis
No ratings yet
Chapter 2 BSC TY Statistical Data Analysis
124 pages
Week - 6-7
No ratings yet
Week - 6-7
9 pages
Statistics For Data Science
No ratings yet
Statistics For Data Science
26 pages
Unit-3 DS Students
No ratings yet
Unit-3 DS Students
35 pages
Statistics For Data Science 1
No ratings yet
Statistics For Data Science 1
65 pages
Statistics For Data Analytics
No ratings yet
Statistics For Data Analytics
15 pages
Statistical Methods for Data Science
No ratings yet
Statistical Methods for Data Science
31 pages
Ms Data Science S, 24 (WEEK# 1)
No ratings yet
Ms Data Science S, 24 (WEEK# 1)
30 pages
3 Data Visualization
No ratings yet
3 Data Visualization
75 pages
Descriptive & Inferential Stats Guide
No ratings yet
Descriptive & Inferential Stats Guide
13 pages
Lecture 1ASADA Descriptive Stats
No ratings yet
Lecture 1ASADA Descriptive Stats
38 pages
Jerome Statistics
No ratings yet
Jerome Statistics
12 pages
Statistical Analysis of Bridge Conditions
No ratings yet
Statistical Analysis of Bridge Conditions
9 pages
Ads Exp1
No ratings yet
Ads Exp1
6 pages
Unit II TYCS DS
No ratings yet
Unit II TYCS DS
176 pages
DA Practical Lab 02 Statistical Functions
No ratings yet
DA Practical Lab 02 Statistical Functions
6 pages
Data Analysis and Data Visualization Basics 2
No ratings yet
Data Analysis and Data Visualization Basics 2
50 pages
Article Review 1 Eng
No ratings yet
Article Review 1 Eng
30 pages
5 - Data Summaries and Visualization
No ratings yet
5 - Data Summaries and Visualization
97 pages
It B.tech II Year II Sem DV (R18a0555)
No ratings yet
It B.tech II Year II Sem DV (R18a0555)
73 pages
Data Analysis and Visualization EDA
No ratings yet
Data Analysis and Visualization EDA
51 pages
DEV Unit 3
No ratings yet
DEV Unit 3
24 pages
Statistics Basics for Data Science
100% (2)
Statistics Basics for Data Science
27 pages
Quantitative Data Coding & Analysis Guide
No ratings yet
Quantitative Data Coding & Analysis Guide
104 pages
Data science-Unit-3-Complete
No ratings yet
Data science-Unit-3-Complete
33 pages
Descriptive Statistics
No ratings yet
Descriptive Statistics
63 pages
Module 1 Overview - of - Statistics
No ratings yet
Module 1 Overview - of - Statistics
11 pages
Lecture 7
No ratings yet
Lecture 7
20 pages
Data Science & Machine Learning Algorithms - A CONCISEtasets, and Free Text Books) - Ananthu S Chakravarthi
100% (3)
Data Science & Machine Learning Algorithms - A CONCISEtasets, and Free Text Books) - Ananthu S Chakravarthi
90 pages
Chapter 1: Descriptive Statistics: Example 1: Making Steel Rods
No ratings yet
Chapter 1: Descriptive Statistics: Example 1: Making Steel Rods
20 pages
006 - Descriptive Statistics
No ratings yet
006 - Descriptive Statistics
47 pages
Intro to Descriptive Statistics
100% (2)
Intro to Descriptive Statistics
57 pages
Topic 8 Data Processing and Analysis PDF
No ratings yet
Topic 8 Data Processing and Analysis PDF
157 pages
Unit 1 AIDS
No ratings yet
Unit 1 AIDS
128 pages
Nummerical Summaries
No ratings yet
Nummerical Summaries
11 pages
1-Descriptive Statistics
No ratings yet
1-Descriptive Statistics
44 pages
1-Descriptive Statistics
No ratings yet
1-Descriptive Statistics
44 pages
Lecture Notes 2 - Descriptive Statistics-1720598791715
No ratings yet
Lecture Notes 2 - Descriptive Statistics-1720598791715
21 pages
L1-D3 Concepts of Data Analysis
No ratings yet
L1-D3 Concepts of Data Analysis
17 pages
Presentation On Data Analysis: Submitted by
No ratings yet
Presentation On Data Analysis: Submitted by
38 pages
Business Analytics
No ratings yet
Business Analytics
44 pages
5 - Data Summaries and Visualization
No ratings yet
5 - Data Summaries and Visualization
87 pages
Data Mining-5 - Getting Know Data 1
No ratings yet
Data Mining-5 - Getting Know Data 1
27 pages
Stastics For Data Science1 (Quiz1 Notes)
No ratings yet
Stastics For Data Science1 (Quiz1 Notes)
2 pages
Data Science - Unit 2
No ratings yet
Data Science - Unit 2
57 pages
What Are Measures of Central Tendency
No ratings yet
What Are Measures of Central Tendency
5 pages
Data Analytics in Software Engineering
No ratings yet
Data Analytics in Software Engineering
39 pages
Arm & Sa Spring 13
No ratings yet
Arm & Sa Spring 13
64 pages
MMW Data Management and Analysis
No ratings yet
MMW Data Management and Analysis
96 pages
Session 3
No ratings yet
Session 3
61 pages
2 - Unit-Ii-2
No ratings yet
2 - Unit-Ii-2
66 pages
Machine Learning Attribute Types Explained
No ratings yet
Machine Learning Attribute Types Explained
31 pages
Practical Financial Accounting 2 Valix 2021 Ed
100% (12)
Practical Financial Accounting 2 Valix 2021 Ed
398 pages
TABAG - Transfer & Business Taxation (2023 Edition)
91% (11)
TABAG - Transfer & Business Taxation (2023 Edition)
533 pages
Auditing and Assurance Principles (2022) by Escala
77% (13)
Auditing and Assurance Principles (2022) by Escala
472 pages
Cpa Reviewer in Taxation 2024 by Tabag
100% (3)
Cpa Reviewer in Taxation 2024 by Tabag
872 pages
Transfer and Business Taxes Solutions Manual Tabag Garcia 3rd Edition PDF Free
83% (6)
Transfer and Business Taxes Solutions Manual Tabag Garcia 3rd Edition PDF Free
39 pages
Advance Financial Accounting Reporting by Dayag (2023 Edition)
80% (5)
Advance Financial Accounting Reporting by Dayag (2023 Edition)
1,236 pages
Test Bank Chapter14 Capital Budgeting
100% (3)
Test Bank Chapter14 Capital Budgeting
35 pages
CPA Reviewer in Taxation 2022 - Tabag
94% (16)
CPA Reviewer in Taxation 2022 - Tabag
628 pages
De JESUS - Advanced Financial Accounting and Reporting Reviewer (2023 Edition)
100% (13)
De JESUS - Advanced Financial Accounting and Reporting Reviewer (2023 Edition)
994 pages
Quiz 1 - Estate Tax
80% (5)
Quiz 1 - Estate Tax
7 pages
Income Taxation 2019 Tabag Whole Book PDF
79% (14)
Income Taxation 2019 Tabag Whole Book PDF
315 pages
(Valix) 2021 Practical Financial Accounting 1
90% (10)
(Valix) 2021 Practical Financial Accounting 1
414 pages
RFBT Reviewer by Laco Et Al (2022)
87% (15)
RFBT Reviewer by Laco Et Al (2022)
469 pages
Business Combinations Exam Review
77% (13)
Business Combinations Exam Review
18 pages
ReSA B44 TAX First PB Exam Questions Answers Solutions
100% (3)
ReSA B44 TAX First PB Exam Questions Answers Solutions
14 pages
Auditing Theory by Jekell Salosagcol 2021
91% (11)
Auditing Theory by Jekell Salosagcol 2021
391 pages
Notes in Business Law RFBT 2023 Edition by Soriano Compress
67% (3)
Notes in Business Law RFBT 2023 Edition by Soriano Compress
589 pages
Auditing & Assurance Concepts and Application Part 2 2021 - Asuncion
100% (8)
Auditing & Assurance Concepts and Application Part 2 2021 - Asuncion
412 pages
Estate Tax Practice Exercises
100% (1)
Estate Tax Practice Exercises
6 pages
Intermediate Accounting 2019 Volume 3 Valix
89% (9)
Intermediate Accounting 2019 Volume 3 Valix
572 pages
Salosagcol Auditing Theory Answer Key
100% (1)
Salosagcol Auditing Theory Answer Key
24 pages
AT Escala 2022 Answer Key
100% (2)
AT Escala 2022 Answer Key
9 pages
8905 Corporate Liquidation Answers PDF
100% (2)
8905 Corporate Liquidation Answers PDF
14 pages
Ia Vol 1 Valix 2019 Answer Key
96% (52)
Ia Vol 1 Valix 2019 Answer Key
231 pages
ReSA B47 RFBT Final PB Exam - Questions & Answers
No ratings yet
ReSA B47 RFBT Final PB Exam - Questions & Answers
13 pages
INTERMEDIATE ACCOUNTING 2 VALIX (Solution Manual)
75% (8)
INTERMEDIATE ACCOUNTING 2 VALIX (Solution Manual)
210 pages
Answer Key INCOME TAXATION 2023 2024 by Rex Banggawan - 20 (1) - 20 (1) - 20 (1) - 20
100% (3)
Answer Key INCOME TAXATION 2023 2024 by Rex Banggawan - 20 (1) - 20 (1) - 20 (1) - 20
29 pages
Disarranged Pages in MAS Book
100% (2)
Disarranged Pages in MAS Book
363 pages
Partnership Operation Exercises With Answers and Solutions
75% (20)
Partnership Operation Exercises With Answers and Solutions
6 pages
Auditing Problems Roque 2023-2024
100% (4)
Auditing Problems Roque 2023-2024
385 pages
Course - Outline - Inferential Statistics Fall-19, BS (A&F) - IV
100% (1)
Course - Outline - Inferential Statistics Fall-19, BS (A&F) - IV
7 pages
Chapter 5 Data Analysis Ab
No ratings yet
Chapter 5 Data Analysis Ab
56 pages
Boots Trapping
No ratings yet
Boots Trapping
4 pages
Effect of Hands-On Activities On Achievement and Retention of Senior Secondary Chemistry Students in Stoichiometry
No ratings yet
Effect of Hands-On Activities On Achievement and Retention of Senior Secondary Chemistry Students in Stoichiometry
6 pages
J. K.Shah Classes Regression Analysis
No ratings yet
J. K.Shah Classes Regression Analysis
21 pages
ANOVA in Linear Regression Analysis
No ratings yet
ANOVA in Linear Regression Analysis
606 pages
TEST of Correlation
No ratings yet
TEST of Correlation
2 pages
Attachment 1
No ratings yet
Attachment 1
3 pages
Data Analysis for Researchers
No ratings yet
Data Analysis for Researchers
27 pages
Prob 1804
No ratings yet
Prob 1804
1 page
CH07 Wooldridge 7e PPT 2pp
No ratings yet
CH07 Wooldridge 7e PPT 2pp
25 pages
Data Can Be Classified As Qualitative or Quantitative.: Recall From Yesterday
No ratings yet
Data Can Be Classified As Qualitative or Quantitative.: Recall From Yesterday
5 pages
Simplifying ISO 21748 for Labs
No ratings yet
Simplifying ISO 21748 for Labs
4 pages
Literature Review On Logistic Regression Model
100% (2)
Literature Review On Logistic Regression Model
5 pages
Statistics Midterm Study Guide
No ratings yet
Statistics Midterm Study Guide
6 pages
Mcqs of Hypothesis
82% (11)
Mcqs of Hypothesis
2 pages
3 Variations 1
No ratings yet
3 Variations 1
21 pages
Multiple Regression Analysis, The Problem of Estimation
No ratings yet
Multiple Regression Analysis, The Problem of Estimation
53 pages
Journal of Safety Research: Frank Gross, Eric T. Donnell
No ratings yet
Journal of Safety Research: Frank Gross, Eric T. Donnell
13 pages
Data Visualization Techniques Tools
No ratings yet
Data Visualization Techniques Tools
8 pages
Probability & Statistics Assignment
No ratings yet
Probability & Statistics Assignment
2 pages
Hypothesis Testing for Engineers
No ratings yet
Hypothesis Testing for Engineers
95 pages
Probability Assignment Questions
No ratings yet
Probability Assignment Questions
6 pages
CP4
No ratings yet
CP4
3 pages
Enders (2014) - Statistical Tables
No ratings yet
Enders (2014) - Statistical Tables
6 pages
BSC PHY QU Descriptive Statistics Fundamental of Statistics 2081
No ratings yet
BSC PHY QU Descriptive Statistics Fundamental of Statistics 2081
2 pages
Factorial Design
No ratings yet
Factorial Design
12 pages
Central Tendency and Variation Practice Exercises-1
No ratings yet
Central Tendency and Variation Practice Exercises-1
3 pages
Improving Student Learning Outcomes in Economics
No ratings yet
Improving Student Learning Outcomes in Economics
7 pages
OPR201 Midterm Exam
No ratings yet
OPR201 Midterm Exam
3 pages