0% found this document useful (0 votes)

26 views3 pages

Unit 1 BDA

unit 1 of big data analytics

Uploaded by

saisri.pentapati

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views3 pages

Unit 1 BDA

unit 1 of big data analytics

Uploaded by

saisri.pentapati

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Unit 1: Introduction to Big Data

(10-mark answers for each topic)

1. Big Data and Its Importance

• Definition: Big Data refers to datasets that are too large or complex to process using
traditional methods.

• Importance:

o Enables data-driven decision-making. o Provides predictive insights

in fields like healthcare, finance, and marketing.

o Drives innovation and operational efficiency.

• Key Applications:

o Healthcare: Personalized medicine and real-time monitoring.

o Retail: Enhanced customer personalization and inventory management.

2. Characteristics of Big Data (5 V's)

The key properties of Big Data are summarized as:

1. Volume: The size of data, measured in terabytes or petabytes.

2. Velocity: The speed at which data is generated and processed (e.g., social media).

3. Variety: Data in different formats like text, images, videos, etc.

4. Veracity: Ensuring accuracy and reliability of data despite inconsistencies.

5. Value: Deriving meaningful insights to enhance business operations.

3. Big Data Analytics

• Definition: The process of analyzing large and varied datasets to uncover hidden
patterns, correlations, and actionable insights.

• Steps in Big Data Analytics:

1. Data Collection: Gathering structured, semi-structured, and unstructured

data.

2. Storage: Using platforms like Hadoop and Spark.

3. Analysis: Employing algorithms for predictive, descriptive, and prescriptive
insights.

• Real-World Example:

o In e-commerce, analytics is used to recommend products based on browsing

history.

4. Basic Requirements for Big Data Analytics

1. Hardware Requirements: High-performance servers and storage systems.

2. Frameworks: Tools like Hadoop and Spark for data storage and processing.

3. Scalable Algorithms: Efficient algorithms for handling large datasets.

4. Expertise: Skilled professionals to manage data pipelines.

5. Big Data Applications

1. Healthcare: Disease outbreak prediction and real-time patient monitoring.

2. Finance: Fraud detection and algorithmic trading.

3. Retail: Targeted marketing and demand forecasting.

4. Transportation: Traffic prediction and route optimization.

6. MapReduce Framework

• Definition: A programming model for processing large-scale data in parallel.

• Phases:

1. Map Phase: Breaks data into key-value pairs.

2. Shuffle and Sort: Groups similar keys together.

3. Reduce Phase: Aggregates data to produce the final result.

Diagram: Refer to the MapReduce Workflow.

7. Algorithms Using MapReduce

• Examples:

1. Word Count: Counts the frequency of each word in a dataset.

2. Sorting: Arranges data in a specific order.

8. NoSQL Databases

• Definition: Non-relational databases optimized for Big Data.

• Types:

1. Key-Value Databases: Efficient for lookup operations (e.g., Redis).

2. Column-Family Databases: Stores data in columns instead of rows (e.g.,

Cassandra).

3. Document Databases: JSON-like documents (e.g., MongoDB).

4. Graph Databases: Nodes and edges represent relationships (e.g., Neo4j).

Diagram: Refer to the SQL vs NoSQL Comparison.

Big Data Ashish
No ratings yet
Big Data Ashish
7 pages
Unit 1 Big Data Analysis
No ratings yet
Unit 1 Big Data Analysis
2 pages
Big Data Analytics Unit - 1 Notes
No ratings yet
Big Data Analytics Unit - 1 Notes
24 pages
Introduction To Big Data Notes
No ratings yet
Introduction To Big Data Notes
4 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
14 pages
Big Data Fundamentals Overview
No ratings yet
Big Data Fundamentals Overview
3 pages
What's Is Big D-WPS Office
No ratings yet
What's Is Big D-WPS Office
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Introduction To Big Data Analytics Notes 22684
No ratings yet
Introduction To Big Data Analytics Notes 22684
3 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
Question Bank
No ratings yet
Question Bank
62 pages
Big Data Analytics Lecture Notes
No ratings yet
Big Data Analytics Lecture Notes
86 pages
Big Data Analytics Overview and Insights
No ratings yet
Big Data Analytics Overview and Insights
6 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
36 pages
Bda A23v12bigdata Analytics Unit1
No ratings yet
Bda A23v12bigdata Analytics Unit1
36 pages
BD4251 Unitwise Notes
No ratings yet
BD4251 Unitwise Notes
3 pages
Big Data Notes
No ratings yet
Big Data Notes
89 pages
Big Data Basics: Key Concepts & Tools
No ratings yet
Big Data Basics: Key Concepts & Tools
4 pages
Unit 1 B Tech 3 Year BD
No ratings yet
Unit 1 B Tech 3 Year BD
10 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
28 pages
Understanding Big Data Analytics Concepts
No ratings yet
Understanding Big Data Analytics Concepts
39 pages
Big Data Analytics Notes
No ratings yet
Big Data Analytics Notes
130 pages
BDA Notes Part 1
No ratings yet
BDA Notes Part 1
11 pages
Big Data Unit 1 Easy Notes (Edushine Classes)
No ratings yet
Big Data Unit 1 Easy Notes (Edushine Classes)
21 pages
FUNDAMENTALS OF BIG DATA ANALYTICS Digital Notes
No ratings yet
FUNDAMENTALS OF BIG DATA ANALYTICS Digital Notes
121 pages
Techknowledge Publication: Big Data Analytics
0% (1)
Techknowledge Publication: Big Data Analytics
156 pages
BDA Unit 1
No ratings yet
BDA Unit 1
10 pages
BDA IA1 New
No ratings yet
BDA IA1 New
21 pages
Title - Concept of Big Data: Presented by - Divyanshu Upadhyay Naman Gupta Adarsh Pandey Pankaj Chaudhary Shivbrat Singh
No ratings yet
Title - Concept of Big Data: Presented by - Divyanshu Upadhyay Naman Gupta Adarsh Pandey Pankaj Chaudhary Shivbrat Singh
17 pages
UNIT-1:Overview of Big Data
No ratings yet
UNIT-1:Overview of Big Data
10 pages
Big Data Unit 1 Overview
No ratings yet
Big Data Unit 1 Overview
2 pages
Understanding Big Data Applications and Challenges
No ratings yet
Understanding Big Data Applications and Challenges
10 pages
cp5293 Big Data Analytics Question Bank
0% (1)
cp5293 Big Data Analytics Question Bank
13 pages
Cp5293 Big Data Analytics Question Bank
0% (1)
Cp5293 Big Data Analytics Question Bank
13 pages
Advanced Database Management Systems Guide
No ratings yet
Advanced Database Management Systems Guide
30 pages
Bigdata
No ratings yet
Bigdata
54 pages
Very Imp Read Once
No ratings yet
Very Imp Read Once
30 pages
Big Data
No ratings yet
Big Data
67 pages
Overview of Big Data
No ratings yet
Overview of Big Data
7 pages
Understanding Big Data Analytics Essentials
No ratings yet
Understanding Big Data Analytics Essentials
39 pages
Big Data Analytics Essentials
No ratings yet
Big Data Analytics Essentials
3 pages
Exam Prep: Big Data Insights
No ratings yet
Exam Prep: Big Data Insights
87 pages
Big Data Analytics
No ratings yet
Big Data Analytics
8 pages
Understanding Big Data Analytics Basics
No ratings yet
Understanding Big Data Analytics Basics
2 pages
Unit-1 Bda
No ratings yet
Unit-1 Bda
5 pages
Chapter 5
No ratings yet
Chapter 5
8 pages
Key Characteristics of Big Data Explained
No ratings yet
Key Characteristics of Big Data Explained
18 pages
Big Data Analytics: Key Concepts & Benefits
No ratings yet
Big Data Analytics: Key Concepts & Benefits
4 pages
Big Data: Definition, Tools, and Trends
No ratings yet
Big Data: Definition, Tools, and Trends
4 pages
Big Data Assignment
No ratings yet
Big Data Assignment
2 pages
Big Data Analytics Overview and Insights
No ratings yet
Big Data Analytics Overview and Insights
11 pages
Big Data Module1 Answers Elaborated (1) (IA1)
No ratings yet
Big Data Module1 Answers Elaborated (1) (IA1)
4 pages
Understanding Big Data and Hadoop Basics
No ratings yet
Understanding Big Data and Hadoop Basics
17 pages
Bda QB
No ratings yet
Bda QB
24 pages
Understanding Big Data: Key Insights
No ratings yet
Understanding Big Data: Key Insights
5 pages
Microsoft Word - Lecture 1
No ratings yet
Microsoft Word - Lecture 1
55 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
CCS334
No ratings yet
CCS334
55 pages
Daily Checklist
No ratings yet
Daily Checklist
3 pages
ITSEC Asia Internship Openings May 2025
No ratings yet
ITSEC Asia Internship Openings May 2025
7 pages
SQL Server Index Maintenance
No ratings yet
SQL Server Index Maintenance
5 pages
Salesforce Health Care Project
100% (1)
Salesforce Health Care Project
46 pages
Normalizing Campaign Contribution Data
No ratings yet
Normalizing Campaign Contribution Data
10 pages
Nandha Engineering College ERODE - 638 052: (Autonomous)
No ratings yet
Nandha Engineering College ERODE - 638 052: (Autonomous)
28 pages
NETAPP How Hot Spare Disks Work
No ratings yet
NETAPP How Hot Spare Disks Work
1 page
SS 2 Data Processing 1ST Term 20172018 Exam
No ratings yet
SS 2 Data Processing 1ST Term 20172018 Exam
9 pages
SMS Spam Detection Using Machine Learning
No ratings yet
SMS Spam Detection Using Machine Learning
12 pages
Malware Outbreak Response Playbook
No ratings yet
Malware Outbreak Response Playbook
5 pages
Agentforce Specialist Demo
No ratings yet
Agentforce Specialist Demo
10 pages
Horizon Report Metatrends Overview
100% (1)
Horizon Report Metatrends Overview
1 page
XE101
No ratings yet
XE101
1 page
Dan Brower Resume
No ratings yet
Dan Brower Resume
3 pages
C2C Online Bookstore System Overview
No ratings yet
C2C Online Bookstore System Overview
35 pages
Week 08
No ratings yet
Week 08
131 pages
Unit 1-MCQ-DV
No ratings yet
Unit 1-MCQ-DV
5 pages
23 Library Info Science PG STD
No ratings yet
23 Library Info Science PG STD
4 pages
Case Study - Review0 Mohan K RA2412049015087
No ratings yet
Case Study - Review0 Mohan K RA2412049015087
7 pages
Anirban CV NEW 17-03-2025
No ratings yet
Anirban CV NEW 17-03-2025
1 page
NLQ PDF
No ratings yet
NLQ PDF
5 pages
Programming Assignment Unit 3
No ratings yet
Programming Assignment Unit 3
9 pages
Sub Topic 2 Trends and Issues in ICT
No ratings yet
Sub Topic 2 Trends and Issues in ICT
2 pages
NFS File Migration To Isilon PDF
No ratings yet
NFS File Migration To Isilon PDF
46 pages
04 - Data Dictionary
No ratings yet
04 - Data Dictionary
28 pages
Performance Testing Notes
No ratings yet
Performance Testing Notes
9 pages
Enterprise Computing Detailed Notes
No ratings yet
Enterprise Computing Detailed Notes
4 pages
Dolphin 365 Contract Management Overview
No ratings yet
Dolphin 365 Contract Management Overview
10 pages
Prompt Engineering Guide - 1
No ratings yet
Prompt Engineering Guide - 1
80 pages
Interview Prep
No ratings yet
Interview Prep
1 page

Unit 1 BDA

Uploaded by

Unit 1 BDA

Uploaded by

Unit 1: Introduction to Big Data

(10-mark answers for each topic)

1. Big Data and Its Importance

o Enables data-driven decision-making. o Provides predictive insights

o Drives innovation and operational efficiency.

o Healthcare: Personalized medicine and real-time monitoring.

o Retail: Enhanced customer personalization and inventory management.

2. Characteristics of Big Data (5 V's)

The key properties of Big Data are summarized as:

1. Volume: The size of data, measured in terabytes or petabytes.

3. Variety: Data in different formats like text, images, videos, etc.

4. Veracity: Ensuring accuracy and reliability of data despite inconsistencies.

5. Value: Deriving meaningful insights to enhance business operations.

3. Big Data Analytics

• Steps in Big Data Analytics:

1. Data Collection: Gathering structured, semi-structured, and unstructured

2. Storage: Using platforms like Hadoop and Spark.

o In e-commerce, analytics is used to recommend products based on browsing

4. Basic Requirements for Big Data Analytics

1. Hardware Requirements: High-performance servers and storage systems.

3. Scalable Algorithms: Efficient algorithms for handling large datasets.

4. Expertise: Skilled professionals to manage data pipelines.

5. Big Data Applications

1. Healthcare: Disease outbreak prediction and real-time patient monitoring.

2. Finance: Fraud detection and algorithmic trading.

3. Retail: Targeted marketing and demand forecasting.

4. Transportation: Traffic prediction and route optimization.

• Definition: A programming model for processing large-scale data in parallel.

1. Map Phase: Breaks data into key-value pairs.

2. Shuffle and Sort: Groups similar keys together.

3. Reduce Phase: Aggregates data to produce the final result.

Diagram: Refer to the MapReduce Workflow.

7. Algorithms Using MapReduce

1. Word Count: Counts the frequency of each word in a dataset.

• Definition: Non-relational databases optimized for Big Data.

1. Key-Value Databases: Efficient for lookup operations (e.g., Redis).

2. Column-Family Databases: Stores data in columns instead of rows (e.g.,

3. Document Databases: JSON-like documents (e.g., MongoDB).

4. Graph Databases: Nodes and edges represent relationships (e.g., Neo4j).

Diagram: Refer to the SQL vs NoSQL Comparison.

You might also like