0% found this document useful (0 votes)

17 views4 pages

Data Dispersion Concepts Guide

Unit 2 covers data concepts related to dispersion, including range, quartiles, variance, and standard deviation, with formulas and examples provided. It emphasizes the importance of the interquartile range (IQR) for robust data analysis and outlier detection. Additionally, it introduces WEKA as a tool for data preprocessing and visualization, outlining steps for analyzing dispersion using the software.

Uploaded by

sakshiiiur9255

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views4 pages

Data Dispersion Concepts Guide

Uploaded by

sakshiiiur9255

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Unit 2: Know Data Concepts

1.1. Dispersion:
1) Range: Range measures the spread of a dataset by
calculating the difference between the largest and smallest
values.

Formula:

Range = Maximum Value - Minimum Value

Example:

Dataset: 5, 10, 15, 20, 25

Range = 25 – 5 = 20

2) Quartiles: Quartiles divide the dataset into four equal parts

after sorting it in ascending order,
a) Q1 (1st Quartile): The median of the lower half of data.
b) Q2 (2nd Quartile): The median of the entire dataset.
c) Q3 (3rd Quartile): The median of the upper half of data.

Interquartile Range (IQR): Measures the spread of the

middle 50% of data, calculated as:

IQR = Q3 - Q1

Example:

Dataset: 4, 8, 15, 16, 23, 42, 50

Q1 = 8, Q2 (median) = 16, Q3 = 42

1
IQR = 42 – 8 = 34

3) Variance: Variance measures how much each data point

deviates from the mean, averaged over the dataset.

Formula:
𝑛
2
∑𝑖=1(𝑥𝑖 −𝑥̅ )2
Variance(σ ) =
𝑛

Where:

𝑥𝑖 = individual data points,

𝑥̅ = mean,

n = number of data points.

Example:

Dataset: 2, 4, 6

𝑥̅ = 4,

(2 − 4)2 +(4 − 4)2 +(6 − 4)2

Variance =
3

Variance = 2.67.

4) Standard Deviation (SD): SD is the square root of variance,

representing the average distance from the mean in the
original data units.

Formula:

SD(σ) = √Variance

2
Example:

Dataset: 2, 4, 6

Variance = 2.67,

Standard Deviation = √2.67 = 1.63.

5) Data Using Interquartile Range (IQR): IQR focuses on the

central portion of data, ignoring extreme values (outliers). It's
robust and less sensitive to outliers compared to range.

Detecting Outliers:

Outliers lie outside,

Lower Bound = Q1 − 1.5 × IQR

Upper Bound = Q3 + 1.5 × IQR

Example:

Dataset: 4, 8, 15, 16, 23, 42, 50

Q1 = 8, Q3 = 42,

IQR = 42 – 8 = 34.

Lower Bound = 8 - 1.5(34) = −43,

Upper Bound = 42 + 1.5(34) = 93.

Data points 4, and 50 are within bounds, so there are no

outliers.

3
6) WEKA: WEKA (Waikato Environment for Knowledge
Analysis) is a machine learning tool for data preprocessing,
visualization, and applying machine learning algorithms.

Steps to Analyse Dispersion in WEKA:

a) Load Dataset: Open WEKA and load your dataset in

ARFF, CSV, or other supported formats.
b) Explore Summary Statistics:
i. Go to the Preprocess tab.
ii. Click on the dataset to see summary statistics for
attributes,
Min, Max, Mean, Standard Deviation, and more.
c) Filter for Quartiles or IQR:
i. Use filters like NumericToNominal for binning data
into quartiles.
ii. Use the Interquartile Range filter to detect and
handle outliers.
d) Visualize Data: Use the Visualize tab to plot boxplots or
scatter plots that show dispersion, quartiles, and outliers.
e) Export Results: Export pre-processed data or statistical
outputs for further analysis.

Measures of Dispersion Explained
No ratings yet
Measures of Dispersion Explained
8 pages
Measures of Dispersion Explained
No ratings yet
Measures of Dispersion Explained
20 pages
EDA: Key Stats & Visualizations in Python
No ratings yet
EDA: Key Stats & Visualizations in Python
15 pages
Variability & Normal Distribution Guide
100% (1)
Variability & Normal Distribution Guide
61 pages
Mean, Median, and Mode Explained
No ratings yet
Mean, Median, and Mode Explained
4 pages
ADS Imp Ans
No ratings yet
ADS Imp Ans
11 pages
QTT Project 2 2023
No ratings yet
QTT Project 2 2023
16 pages
Answers IBS
No ratings yet
Answers IBS
13 pages
Measures of Spread and Dispersion
No ratings yet
Measures of Spread and Dispersion
20 pages
Measures of Dispersion
No ratings yet
Measures of Dispersion
23 pages
Report Group D
No ratings yet
Report Group D
100 pages
Measures of Variation, Quartiles and Percentiles, Skewness and Kurtosis
No ratings yet
Measures of Variation, Quartiles and Percentiles, Skewness and Kurtosis
16 pages
Data Management in Measurement CODING
No ratings yet
Data Management in Measurement CODING
27 pages
Understanding Measures of Variability
No ratings yet
Understanding Measures of Variability
17 pages
02data Part2
No ratings yet
02data Part2
34 pages
Week - 1 Day - 1 Descriptive Statistics
No ratings yet
Week - 1 Day - 1 Descriptive Statistics
40 pages
Measures of Spread
0% (2)
Measures of Spread
19 pages
Computation Variation and Quartile
No ratings yet
Computation Variation and Quartile
18 pages
Standard Deviation, Interquartile Range + Outliers
No ratings yet
Standard Deviation, Interquartile Range + Outliers
7 pages
Data Variability Explained
No ratings yet
Data Variability Explained
3 pages
Lesson II: Measures of Variability: Example 1
No ratings yet
Lesson II: Measures of Variability: Example 1
21 pages
Measure of Dispersion
No ratings yet
Measure of Dispersion
23 pages
Measurement of Dispersion
No ratings yet
Measurement of Dispersion
4 pages
Data Mining-5 - Getting Know Data 1
No ratings yet
Data Mining-5 - Getting Know Data 1
27 pages
Engineering Data Analysis Guide
No ratings yet
Engineering Data Analysis Guide
25 pages
Practice 3 Measures of Dispersion 2023 09 20 19 02 53
No ratings yet
Practice 3 Measures of Dispersion 2023 09 20 19 02 53
18 pages
DAAN436277 Buoi09 EDA
No ratings yet
DAAN436277 Buoi09 EDA
132 pages
Math Reviewer
No ratings yet
Math Reviewer
7 pages
2 - Unit-Ii-2
No ratings yet
2 - Unit-Ii-2
66 pages
Representation of Data - 1.1.4
No ratings yet
Representation of Data - 1.1.4
6 pages
QTT201 Ca-2
No ratings yet
QTT201 Ca-2
14 pages
ED242 LEC4 Measures of Variability
No ratings yet
ED242 LEC4 Measures of Variability
22 pages
CHP 2
No ratings yet
CHP 2
52 pages
Lesson2 Measures of Variation
No ratings yet
Lesson2 Measures of Variation
28 pages
Variability Final
No ratings yet
Variability Final
53 pages
Measures of Variation PDF
No ratings yet
Measures of Variation PDF
45 pages
Fundamentals of Statistics With MS Excel
100% (1)
Fundamentals of Statistics With MS Excel
83 pages
Outliers
No ratings yet
Outliers
5 pages
Topic 8 - Measures of Variations
No ratings yet
Topic 8 - Measures of Variations
14 pages
P3measure of Dispersion
No ratings yet
P3measure of Dispersion
25 pages
Understanding Measures of Dispersion
No ratings yet
Understanding Measures of Dispersion
42 pages
Understanding Measures of Variability
No ratings yet
Understanding Measures of Variability
24 pages
B. Data Management
No ratings yet
B. Data Management
61 pages
L1-D3 Concepts of Data Analysis
No ratings yet
L1-D3 Concepts of Data Analysis
17 pages
Qtymeth Dispersion
No ratings yet
Qtymeth Dispersion
8 pages
Descriptive Statistics
No ratings yet
Descriptive Statistics
19 pages
Statistics Part 1 and 2
No ratings yet
Statistics Part 1 and 2
53 pages
Sta102 3
No ratings yet
Sta102 3
17 pages
Probability & Statistics - Statistics
No ratings yet
Probability & Statistics - Statistics
15 pages
Statistics Midterm Review
No ratings yet
Statistics Midterm Review
21 pages
Add Math - F5A1T1
No ratings yet
Add Math - F5A1T1
14 pages
Measures of Dispersion Topic 11
No ratings yet
Measures of Dispersion Topic 11
8 pages
ISE1204 - Lecture 2
No ratings yet
ISE1204 - Lecture 2
42 pages
Statistics and Probability Theory: Fasih Ur Rehman
No ratings yet
Statistics and Probability Theory: Fasih Ur Rehman
17 pages
Module 1 Overview - of - Statistics
No ratings yet
Module 1 Overview - of - Statistics
11 pages
Practical No.7
No ratings yet
Practical No.7
3 pages
Descriptive Statistics - Measures of Spread: April 2014
No ratings yet
Descriptive Statistics - Measures of Spread: April 2014
5 pages
B A Interview
No ratings yet
B A Interview
276 pages
Maths Lit p1 Gr12 QP Sept2022 - English (Approved) Deaf
No ratings yet
Maths Lit p1 Gr12 QP Sept2022 - English (Approved) Deaf
15 pages
Exam For Grade 6
No ratings yet
Exam For Grade 6
3 pages
Qaacidiyinka Maths
No ratings yet
Qaacidiyinka Maths
7 pages
GCSE Edexcel Maths Grade 7 Revision
No ratings yet
GCSE Edexcel Maths Grade 7 Revision
70 pages
4a-LATIHAN ANALISA SENARIO 1 KLUSTER KERACUNAN METANOL-1
No ratings yet
4a-LATIHAN ANALISA SENARIO 1 KLUSTER KERACUNAN METANOL-1
140 pages
Revision Worksheet-July 2023 (Month: 01) : Cambridge Assessment International Education
No ratings yet
Revision Worksheet-July 2023 (Month: 01) : Cambridge Assessment International Education
2 pages
Refractory Bricks Testing Analysis
No ratings yet
Refractory Bricks Testing Analysis
9 pages
Categorical and Numerical Data Analysis
No ratings yet
Categorical and Numerical Data Analysis
30 pages
STAT Chapters 1&2
No ratings yet
STAT Chapters 1&2
54 pages
Hasil Analisa Univariat
No ratings yet
Hasil Analisa Univariat
17 pages
Measures of Central Tendency Explained
No ratings yet
Measures of Central Tendency Explained
14 pages
ML Lab Manual
No ratings yet
ML Lab Manual
60 pages
3na Statistics 2
No ratings yet
3na Statistics 2
9 pages
ST2187 Block 2
No ratings yet
ST2187 Block 2
27 pages
Descriptive Analytics
No ratings yet
Descriptive Analytics
18 pages
Daily Transactions Project On Jupyter Notebook
No ratings yet
Daily Transactions Project On Jupyter Notebook
17 pages
Y2 Cumulative Review 2 BLANK
No ratings yet
Y2 Cumulative Review 2 BLANK
4 pages
Assignment 1 (Sol.) : Introduction To Data Analytics
No ratings yet
Assignment 1 (Sol.) : Introduction To Data Analytics
4 pages
Student Weights Analysis and Statistics
No ratings yet
Student Weights Analysis and Statistics
9 pages
Manual or Exercise Therapy For Long-Standing
No ratings yet
Manual or Exercise Therapy For Long-Standing
7 pages
Football Player Market Value Analysis
No ratings yet
Football Player Market Value Analysis
12 pages
Putri Fita Kasmi (1) - Pages-2
No ratings yet
Putri Fita Kasmi (1) - Pages-2
11 pages
Grade 11 Economics: Dispersion Measures
No ratings yet
Grade 11 Economics: Dispersion Measures
5 pages
Final Industrial Report
No ratings yet
Final Industrial Report
34 pages
STAT 111 Tutorial Set 2 Exercises
No ratings yet
STAT 111 Tutorial Set 2 Exercises
7 pages
Comprehensive Statistics Guide
No ratings yet
Comprehensive Statistics Guide
81 pages
Methods For Describing Sets of Data
No ratings yet
Methods For Describing Sets of Data
114 pages
Statistics For Data Science
100% (3)
Statistics For Data Science
39 pages
Understanding Statistics Basics
No ratings yet
Understanding Statistics Basics
65 pages