0% found this document useful (0 votes)

54 views4 pages

Assignment 2 ML

The document outlines various data types, including structured, semi-structured, unstructured, quantitative, qualitative, primary, and secondary data, along with their definitions, examples, and analysis methods. It also discusses data collection methods such as surveys, experiments, and observational studies, detailing their purposes, suitable data types, challenges, and impacts on data quality. The information serves as a comprehensive guide for understanding data types and collection methods in data analysis.

Uploaded by

vu.241fa04f26

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

54 views4 pages

Assignment 2 ML

Uploaded by

vu.241fa04f26

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

ML Assignment 2: Exploring Data Types and Data Collection Methods

1. Understanding Data Types

Task 1: Define and Describe Data Types

1. Structured Data
o Definition: Data organized into rows and columns, typically stored in relational
databases.
o Example: An Excel spreadsheet containing employee records.
o Characteristics: Highly organized, easily searchable using SQL, suitable for
traditional data analysis tools.
2. Semi-structured Data
o Definition: Data that does not reside in a traditional database but has some
organizational properties (tags, markers).
o Example: JSON or XML files.
o Characteristics: Flexible structure, allows for hierarchical relationships, needs
special parsing tools.
3. Unstructured Data
o Definition: Data that lacks a predefined format or structure.
o Example: Videos, images, emails, social media posts.
o Characteristics: Requires preprocessing or AI techniques to analyze; storage and
management are more complex.
4. Quantitative Data
o Definition: Numeric data that represents measurable quantities.
o Example: Height, temperature, income.
o Characteristics: Supports statistical and mathematical analysis.
5. Qualitative Data
o Definition: Descriptive data that represents categories or qualities.
o Example: Customer feedback, product reviews.
o Characteristics: Analyzed using thematic or content analysis, not easily
quantifiable.
6. Primary Data
o Definition: Data collected directly by the researcher for a specific purpose.
o Example: Responses from a custom survey.
o Characteristics: Original, tailored to specific research needs, usually more
accurate.
7. Secondary Data
o Definition: Data collected by others, used for a purpose different from its original
intent.
o Example: Government census data.
o Characteristics: Readily available, less costly, but may not fit research needs
exactly.

Task 2: Implications for Data Analysis

• Structured Data: Easily analyzed using SQL and statistical software. Visualization tools
like bar charts, line graphs, and dashboards work well.
• Semi-structured Data: Requires parsing and transformation before analysis. Techniques
include JSON/XML parsers, followed by statistical or machine learning tools.
• Unstructured Data: Needs preprocessing (e.g., NLP for text, computer vision for
images). Advanced techniques are essential for extracting useful insights.
• Quantitative Data: Ideal for statistical tests (e.g., regression, correlation). Easily
visualized with histograms, scatter plots, and line charts.
• Qualitative Data: Analyzed using coding and thematic analysis. Visualizations include
word clouds, concept maps.
• Primary vs. Secondary Data: Primary data is more relevant but expensive. Secondary
data is faster to obtain but may lack specificity.

Task 3: Data Type Table

Data Type Example Analysis Method

Structured SQL Database Descriptive statistics, SQL queries

Semi-structured JSON/XML Parsing, keyword extraction

Unstructured Video/Text/Image NLP, image recognition, deep learning

Quantitative Test Scores, Age Statistical modeling, regression

Qualitative Interview Transcripts Thematic/content analysis

Primary User-conducted survey Tailored analysis, high relevance

Secondary Public health reports Comparative/trend analysis

2. Data Collection Methods

Task 1: Describe Data Collection Methods

1. Surveys
Description: Structured questionnaires used to collect responses from a
o
population.
o Purpose: Collect standardized data on opinions, behaviors, demographics.
o Use Cases: Market research, academic studies.
2. Experiments
o Description: Controlled tests where variables are manipulated to observe
outcomes.
o Purpose: Establish cause-effect relationships.
o Use Cases: Clinical trials, A/B testing in product development.
3. Observational Studies
o Description: Researchers observe subjects in natural settings without
interference.
o Purpose: Study behaviors and interactions in real-world environments.
o Use Cases: Ethnographic research, user experience studies.

Task 2: Data Type Suitability

• Surveys
o Suitable Data: Structured (Likert scale), Quantitative (age), Qualitative (open-
ended).
o Challenges: Risk of response bias, low response rates.
• Experiments
o Suitable Data: Primarily quantitative.
o Challenges: Costly, may raise ethical concerns, limited to specific settings.
• Observational Studies
o Suitable Data: Qualitative, unstructured (video, audio).
o Challenges: Observer bias, limited control over variables, potential privacy
issues.

Task 3: Impact on Data Quality

• Surveys: Can provide large-scale data quickly, but quality depends on question clarity
and respondent honesty.
• Experiments: High reliability due to controlled variables, but may not reflect real-world
behavior.
• Observational Studies: High ecological validity, but subject to interpretation and harder
to replicate.

Examples:

• Poorly designed surveys can yield unreliable results (e.g., ambiguous questions).
• Experiments with small samples may lack statistical power.
• Observer presence in observational studies may alter subject behavior (Hawthorne
effect).

ML Assignment 2
No ratings yet
ML Assignment 2
7 pages
Exploring Data Types and Data Collection Methods
No ratings yet
Exploring Data Types and Data Collection Methods
4 pages
Unit 1 R
No ratings yet
Unit 1 R
10 pages
LESSON1 ObtainingData
100% (1)
LESSON1 ObtainingData
32 pages
ML Assignment 2
No ratings yet
ML Assignment 2
3 pages
Slide#3 - Understanding Data
No ratings yet
Slide#3 - Understanding Data
44 pages
Data Analysis Essentials Guide
No ratings yet
Data Analysis Essentials Guide
9 pages
Mylesson 3
No ratings yet
Mylesson 3
19 pages
Ttwo
No ratings yet
Ttwo
13 pages
Section A (10-12)
No ratings yet
Section A (10-12)
7 pages
ITE Elective Lecture Materials Data Colletion and Descriptive Statistics
No ratings yet
ITE Elective Lecture Materials Data Colletion and Descriptive Statistics
8 pages
ISE-Activity-lab - 1
No ratings yet
ISE-Activity-lab - 1
6 pages
All Unit Notes
No ratings yet
All Unit Notes
116 pages
Research Methodology Unit 4
No ratings yet
Research Methodology Unit 4
5 pages
Types of Data by Domain
No ratings yet
Types of Data by Domain
14 pages
IX Part B Unit 2 Data Literacy Notes
No ratings yet
IX Part B Unit 2 Data Literacy Notes
9 pages
Comprehensive Guide To Data Collection
No ratings yet
Comprehensive Guide To Data Collection
16 pages
Research Chapter03
No ratings yet
Research Chapter03
38 pages
Chapter 3 - Data Collection 1
No ratings yet
Chapter 3 - Data Collection 1
33 pages
Module 5 Lecture Note
No ratings yet
Module 5 Lecture Note
8 pages
Lec 5
No ratings yet
Lec 5
1 page
Social Surveys and Social Research 2
No ratings yet
Social Surveys and Social Research 2
3 pages
Lecture 6 - Data Sources and Course Project
No ratings yet
Lecture 6 - Data Sources and Course Project
10 pages
4.0 Introduction To Data
No ratings yet
4.0 Introduction To Data
16 pages
Unit 1 - PPT
No ratings yet
Unit 1 - PPT
67 pages
Research Mythology
No ratings yet
Research Mythology
10 pages
Business Research Methods Detailed Answers
No ratings yet
Business Research Methods Detailed Answers
29 pages
Lecture Notes For Tripple I
No ratings yet
Lecture Notes For Tripple I
9 pages
Data Analysis and Interpretation - Oct 21st 2023
No ratings yet
Data Analysis and Interpretation - Oct 21st 2023
66 pages
Unit 1 Data - Analytics
No ratings yet
Unit 1 Data - Analytics
53 pages
How Data Is Col
No ratings yet
How Data Is Col
11 pages
Midterm Notes
No ratings yet
Midterm Notes
10 pages
Module1 Cse2500 Da
No ratings yet
Module1 Cse2500 Da
54 pages
IM M2-Week 3-Organization & Presentation of Data-1
No ratings yet
IM M2-Week 3-Organization & Presentation of Data-1
16 pages
Module 4
No ratings yet
Module 4
13 pages
Da Unit-I
No ratings yet
Da Unit-I
39 pages
AFDM UNIT 2 Notes
No ratings yet
AFDM UNIT 2 Notes
29 pages
Concept of Data Collection Methods
No ratings yet
Concept of Data Collection Methods
9 pages
Jee Loo Apni Zindagi.....
No ratings yet
Jee Loo Apni Zindagi.....
19 pages
Data For Research
No ratings yet
Data For Research
73 pages
BIG DATA ANALYTICS Notes Unit 1 and 2
No ratings yet
BIG DATA ANALYTICS Notes Unit 1 and 2
34 pages
Unit 2 Data Gathering
No ratings yet
Unit 2 Data Gathering
14 pages
1 - Structured Analysis Methodology and Tools (20241204172416)
No ratings yet
1 - Structured Analysis Methodology and Tools (20241204172416)
30 pages
Chapter 2 - Data Science
No ratings yet
Chapter 2 - Data Science
57 pages
5217 Term II
No ratings yet
5217 Term II
18 pages
Identifying Data Sources
No ratings yet
Identifying Data Sources
4 pages
Chapter 2EMR
No ratings yet
Chapter 2EMR
21 pages
Understanding Data Types and Importance
No ratings yet
Understanding Data Types and Importance
52 pages
BigDataAnalytics - Unit1
No ratings yet
BigDataAnalytics - Unit1
21 pages
Data Analytics BCSDS501
No ratings yet
Data Analytics BCSDS501
114 pages
Chapter 1.3 - Data Collection
No ratings yet
Chapter 1.3 - Data Collection
6 pages
Unit 1
No ratings yet
Unit 1
36 pages
Presentation by Abhyuday Sharma
No ratings yet
Presentation by Abhyuday Sharma
27 pages
DATA ANALYSIS - Full - Note - Immersive 2
No ratings yet
DATA ANALYSIS - Full - Note - Immersive 2
13 pages
Chapter 2 Data Science1
No ratings yet
Chapter 2 Data Science1
41 pages
Data Type and Structure
No ratings yet
Data Type and Structure
24 pages
(BIT-601) Data Analytics Question Bank
No ratings yet
(BIT-601) Data Analytics Question Bank
56 pages
History Scotch Pres. Church, St. Gabriel Street
No ratings yet
History Scotch Pres. Church, St. Gabriel Street
879 pages
RFID Vs RF-Enabled Smart Cards
No ratings yet
RFID Vs RF-Enabled Smart Cards
7 pages
Motorola PMLN6588 (NNTN8410A)
No ratings yet
Motorola PMLN6588 (NNTN8410A)
28 pages
Music Team Principles Guide
No ratings yet
Music Team Principles Guide
9 pages
Briggs PLC 6HP 190cc 650 12J900-0117-01 PR
No ratings yet
Briggs PLC 6HP 190cc 650 12J900-0117-01 PR
12 pages
Essential Care for Newborns: Guidelines
No ratings yet
Essential Care for Newborns: Guidelines
8 pages
Sexual Fantasy
100% (5)
Sexual Fantasy
20 pages
(Tribology Series 42) A. Sethuramiah (Eds.) - Lubricated Wear - Science and Technology-Academic Press
100% (1)
(Tribology Series 42) A. Sethuramiah (Eds.) - Lubricated Wear - Science and Technology-Academic Press
297 pages
Pob Sba
No ratings yet
Pob Sba
15 pages
HM61/AM61V: Home Comfort Systems
No ratings yet
HM61/AM61V: Home Comfort Systems
4 pages
3RD Ptest
No ratings yet
3RD Ptest
5 pages
Do Your Genes Make You A Criminal
No ratings yet
Do Your Genes Make You A Criminal
39 pages
Ear Training Guide Audio University 3.0
No ratings yet
Ear Training Guide Audio University 3.0
1 page
Cambridge IGCSE ™: French 0520/41
No ratings yet
Cambridge IGCSE ™: French 0520/41
12 pages
Rubber Expansion Joint Torque Guide
No ratings yet
Rubber Expansion Joint Torque Guide
2 pages
The Digital Transformation of The New York Times
No ratings yet
The Digital Transformation of The New York Times
4 pages
Blackbox & UAT Analysis for Solusimedsosku
No ratings yet
Blackbox & UAT Analysis for Solusimedsosku
9 pages
Ph.D. Coursework in Computer Science 2020
No ratings yet
Ph.D. Coursework in Computer Science 2020
2 pages
LFS Healthcare Invoice - Gurgaon Location
No ratings yet
LFS Healthcare Invoice - Gurgaon Location
1 page
12th English Mcqs by Youth Academy
No ratings yet
12th English Mcqs by Youth Academy
35 pages
Dissertation Is The American Dream Still Alive
100% (2)
Dissertation Is The American Dream Still Alive
5 pages
Shanti Business School: PGDM Trimester-Iii End Term Examination JULY - 2015
No ratings yet
Shanti Business School: PGDM Trimester-Iii End Term Examination JULY - 2015
8 pages
Quinton Q55 Series 90
No ratings yet
Quinton Q55 Series 90
108 pages
Nepal Electricity Loss Report 2076/077
No ratings yet
Nepal Electricity Loss Report 2076/077
9 pages
Interview Preparation
No ratings yet
Interview Preparation
76 pages
Land Law Notes
No ratings yet
Land Law Notes
175 pages
Grade 12 Career Guidance Module: "The Choice of Choosing"
100% (5)
Grade 12 Career Guidance Module: "The Choice of Choosing"
25 pages
Mesc Spe 74-019
No ratings yet
Mesc Spe 74-019
7 pages
Certificate Courses (Al Lisan Ul Arbi - Lughat Ul Quran - Arbic Bol Chal - Librarianship)
No ratings yet
Certificate Courses (Al Lisan Ul Arbi - Lughat Ul Quran - Arbic Bol Chal - Librarianship)
30 pages
MEG 14 Previous Q Papers
No ratings yet
MEG 14 Previous Q Papers
75 pages

Assignment 2 ML

Uploaded by

Assignment 2 ML

Uploaded by

ML Assignment 2: Exploring Data Types and Data Collection Methods

1. Understanding Data Types

Task 2: Implications for Data Analysis

Task 3: Data Type Table

Structured SQL Database Descriptive statistics, SQL queries

Semi-structured JSON/XML Parsing, keyword extraction

Unstructured Video/Text/Image NLP, image recognition, deep learning

Quantitative Test Scores, Age Statistical modeling, regression

Qualitative Interview Transcripts Thematic/content analysis

Primary User-conducted survey Tailored analysis, high relevance

Secondary Public health reports Comparative/trend analysis

2. Data Collection Methods

Task 2: Data Type Suitability

Task 3: Impact on Data Quality

You might also like