Big Data Final Revision Notes

The document provides a comprehensive overview of key concepts in Big Data, including MapReduce, HDFS components, and tools like Apache Pig and Hive. It distinguishes between HiveQL and SQL, explains ETL vs ELT processes, and compares HBase with RDBMS. Additionally, it discusses data collection methods and the importance of data masking for protecting personally identifiable information (PII).

Uploaded by

dhotreanisha09

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

48 views2 pages

Big Data Final Revision Notes

Uploaded by

dhotreanisha09

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Big Data Final Revision Notes – Exam

Quick Recap
MapReduce
- Programming model with Map and Reduce phases.
- Processes large-scale data in parallel.
- Example: Word Count using key-value pairs.

HDFS Components
- NameNode: Manages metadata.
- DataNode: Stores actual data blocks.
- Secondary NameNode: Merges edit logs and fsimage.

Apache Pig
- Scripting platform using Pig Latin.
- Easier than raw MapReduce.
- Key commands: LOAD, STORE, JOIN, GROUP.

Apache Hive
- SQL-like tool for querying Hadoop data.
- Metastore stores schema.
- Supports partitioning, bucketing, indexing.

HiveQL vs SQL
- HiveQL: Used in Hadoop; batch processing.
- SQL: Used in RDBMS; real-time querying.

ELT vs ETL
- ETL: Extract → Transform → Load.
- ELT: Extract → Load → Transform (used in Big Data).

HBase vs RDBMS
- HBase: NoSQL, column-based, schema-free.
- RDBMS: SQL, row-based, fixed schema.
Data Collection Methods
- Log files, sensors, social media.
- Structured vs Unstructured data types.

Data Masking & PII

- PII: Personal data like name, Aadhaar.
- Masking techniques: Substitution, Encryption, Nulling.

Big Data in Real Life

- Fraud detection: Banking alerts, unusual patterns.
- Social media: Hashtag trends, customer behavior.

Big Data SV Publication
No ratings yet
Big Data SV Publication
142 pages
Big Data and Hadoop Notes
No ratings yet
Big Data and Hadoop Notes
3 pages
Big Data Notes Units II III IV
No ratings yet
Big Data Notes Units II III IV
3 pages
Big Data Analytics Short Notes
No ratings yet
Big Data Analytics Short Notes
1 page
Detailed Big Data and Hadoop Notes
No ratings yet
Detailed Big Data and Hadoop Notes
3 pages
Big Data Analytics Question Bank 21CS71
No ratings yet
Big Data Analytics Question Bank 21CS71
4 pages
RGPV Notes - Data Analytics
No ratings yet
RGPV Notes - Data Analytics
3 pages
Big Data Tools and Its Framework
No ratings yet
Big Data Tools and Its Framework
5 pages
Bigdata - Important Topics For Exam
No ratings yet
Bigdata - Important Topics For Exam
1 page
Unit 4 - Class Notes
No ratings yet
Unit 4 - Class Notes
6 pages
Big Data Viva Notes
No ratings yet
Big Data Viva Notes
2 pages
Big Data Notes With Diagrams
No ratings yet
Big Data Notes With Diagrams
3 pages
Big Data & Hadoop Study Guide
No ratings yet
Big Data & Hadoop Study Guide
2 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
3 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
Big Data Assignment Notes
No ratings yet
Big Data Assignment Notes
13 pages
Bigdata Syllabus
No ratings yet
Bigdata Syllabus
3 pages
Introduction to Big Data & Hadoop
No ratings yet
Introduction to Big Data & Hadoop
45 pages
Big Data Short Notes Units II III IV
No ratings yet
Big Data Short Notes Units II III IV
2 pages
Merged
No ratings yet
Merged
7 pages
Big Data Answers All Sets
No ratings yet
Big Data Answers All Sets
6 pages
Model Paper BDA R20 VII Sem
No ratings yet
Model Paper BDA R20 VII Sem
3 pages
BDA Topper Solutions for Mumbai University
No ratings yet
BDA Topper Solutions for Mumbai University
71 pages
Big Data Analytics Objective Questions
No ratings yet
Big Data Analytics Objective Questions
22 pages
Big Data Analytics
No ratings yet
Big Data Analytics
1 page
Big Data Basics - Simple Notes
No ratings yet
Big Data Basics - Simple Notes
4 pages
SYLLABUS
No ratings yet
SYLLABUS
2 pages
Bda (M-4)
No ratings yet
Bda (M-4)
8 pages
BD by Maaz
No ratings yet
BD by Maaz
19 pages
1) Introduction To Big Data
No ratings yet
1) Introduction To Big Data
6 pages
Unit 1 BDA
No ratings yet
Unit 1 BDA
3 pages
Understanding Big Data and Hadoop Basics
No ratings yet
Understanding Big Data and Hadoop Basics
17 pages
Unit 1 Big Data Analysis
No ratings yet
Unit 1 Big Data Analysis
2 pages
Bba13 Notes BDF Unit 1
No ratings yet
Bba13 Notes BDF Unit 1
3 pages
BDA Class3
No ratings yet
BDA Class3
15 pages
CT2 BDTT
No ratings yet
CT2 BDTT
6 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Bigdata Ass2
No ratings yet
Bigdata Ass2
3 pages
BDA Unlocked
100% (1)
BDA Unlocked
69 pages
Gujarat Technological University
No ratings yet
Gujarat Technological University
2 pages
Big Data Analytics Exam Overview
No ratings yet
Big Data Analytics Exam Overview
7 pages
Big Data - Simple Notes
No ratings yet
Big Data - Simple Notes
3 pages
Big Data Analytics Unit Wise Short Note
No ratings yet
Big Data Analytics Unit Wise Short Note
6 pages
Big Data Computing Notes
No ratings yet
Big Data Computing Notes
17 pages
Bda 123
No ratings yet
Bda 123
36 pages
BDA Mid-1 Q&A
No ratings yet
BDA Mid-1 Q&A
27 pages
10 SparkIntroduction BigData 2x
No ratings yet
10 SparkIntroduction BigData 2x
33 pages
Important Big Data Questions AKTU
No ratings yet
Important Big Data Questions AKTU
3 pages
Big Data Concepts and Analytics Overview
No ratings yet
Big Data Concepts and Analytics Overview
3 pages
BDA Notes
No ratings yet
BDA Notes
70 pages
Mrcet R20 Iv 1 QB
No ratings yet
Mrcet R20 Iv 1 QB
79 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
4 pages
BDA Simple 1 To 4
No ratings yet
BDA Simple 1 To 4
11 pages
Big Data QA Essay Short
No ratings yet
Big Data QA Essay Short
5 pages
Map Reduce in Big Data with Hadoop
100% (1)
Map Reduce in Big Data with Hadoop
9 pages
PE CS801A SampleQB2
No ratings yet
PE CS801A SampleQB2
6 pages
Short Questions
No ratings yet
Short Questions
17 pages
MCA - BigData Notes
No ratings yet
MCA - BigData Notes
136 pages

Big Data Final Revision Notes

Uploaded by

Big Data Final Revision Notes

Uploaded by

Big Data Final Revision Notes – Exam

Data Masking & PII

Big Data in Real Life

You might also like