0% found this document useful (0 votes)

17 views4 pages

Written Assignment 4

Uploaded by

Mostafizur Rahman

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views4 pages

Written Assignment 4

Uploaded by

Mostafizur Rahman

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 4

CS-3440-01 -AY2025-T4

Big Data

Written Assignment

Unit-4

Querying Techniques for Big Data: Benefits and Implementation in Organizations

In today’s digital era, organizations generate and collect massive volumes of data from diverse

sources. To turn this big data into actionable insights, organizations must use efficient querying

techniques. Traditional data querying methods often fall short when handling large-scale, high-

velocity, and unstructured data. This paper identifies three widely used querying techniques that

benefit organizations: SQL-on-Hadoop, NoSQL querying, and stream processing querying. It

also explores how organizations are implementing these techniques to improve decision-making,

operations, and customer engagement.

1. SQL-on-Hadoop

SQL-on-Hadoop is a technique that enables querying of big data using SQL-like syntax directly

on data stored in Hadoop Distributed File System (HDFS). Tools like Apache Hive, Impala, and

Spark SQL fall under this category. These platforms extend familiar SQL capabilities to the

distributed and parallel architecture of Hadoop, making it easier for analysts and data scientists

to write complex queries over massive datasets.

Organizations benefit from SQL-on-Hadoop by enabling their existing workforce to work with

big data without learning new programming languages. For example, companies in finance and

healthcare use Hive to process and analyze petabytes of historical data to discover trends and

support forecasting models (Małysiak-Mrozek et al., 2022). The ability to handle schema-on-

read and accommodate different data formats makes this technique valuable in diverse business

settings. Organizations also use Spark SQL to optimize performance through in-memory

computation, which reduces query execution time significantly.

2. NoSQL Querying

NoSQL querying techniques are designed to work with non-relational databases that store

unstructured or semi-structured data. These databases -- such as MongoDB, Cassandra, and

Couchbase -- are highly scalable and flexible. NoSQL systems allow for horizontal scaling,

faster reads/writes, and easy schema evolution.

Organizations implementing NoSQL benefit from its ability to handle large volumes of user-

generated content, logs, or sensor data. E-commerce companies, for instance, use MongoDB to

manage product catalogs, customer interactions, and recommendations based on real-time

behavior. Social media platforms rely on Cassandra for its high availability and fault tolerance.

By querying through application code or built-in query languages like MongoDB’s query API,

businesses can respond to user behavior quickly and deliver personalized content.
3. Stream Processing Querying

Stream processing querying allows organizations to analyze data in real-time as it flows into the

system. Tools such as Apache Kafka, Apache Flink, and Apache Storm support this model. They

enable continuous querying and event detection, making them ideal for applications that require

immediate insight and response.

Organizations apply stream processing techniques in domains such as cybersecurity, fraud

detection, and IoT monitoring. For example, banks use Apache Flink to detect fraudulent

transactions by querying event streams in real-time (Gurusamy et al., 2017). Similarly, logistics

firms use Kafka to track shipment updates, optimize routes, and alert users instantly when

anomalies are detected. Stream processing not only supports operational efficiency but also

enhances customer satisfaction through timely communication and decision-making.

Conclusion

The three querying techniques—SQL-on-Hadoop, NoSQL querying, and stream processing --

offer tailored solutions to the challenges posed by big data. By adopting these methods,

organizations can efficiently manage their data workloads, derive insights at scale, and respond

quickly to dynamic business needs. As big data continues to grow in complexity and volume,

these querying techniques will remain vital for competitive advantage and strategic planning.
References

1. Gurusamy, V., Kannan, S., & Nandhini, K. (2017). The real-time big data processing

framework: Advantages and limitations. International Journal of Computer Sciences and

Engineering, 5(12), 305–312. https://www.researchgate.net/publication/322550872

2. Małysiak-Mrozek, B., Wieszok, J., Pedrycz, W., Ding, W., & Mrozek, D. (2022). High-

efficient fuzzy querying with HiveQL for big data warehousing. IEEE Transactions on

Fuzzy Systems, 30(6), 1823–1837. https://ieeexplore.ieee.org/document/9388934

Written Assignment
No ratings yet
Written Assignment
4 pages
Hadoop
No ratings yet
Hadoop
4 pages
IE494 - Big - Data - Processing - Course - File - Autumn24 - PMJ - PM Jat
No ratings yet
IE494 - Big - Data - Processing - Course - File - Autumn24 - PMJ - PM Jat
5 pages
Big Data Deals With Large Data Sets
No ratings yet
Big Data Deals With Large Data Sets
4 pages
Fundamentals of Working With Big Data in Databases
No ratings yet
Fundamentals of Working With Big Data in Databases
4 pages
Yasir f29 Ass1 Bigdata
No ratings yet
Yasir f29 Ass1 Bigdata
7 pages
Big Data Frameworks
No ratings yet
Big Data Frameworks
3 pages
Unit 1 Big Data
No ratings yet
Unit 1 Big Data
124 pages
Introduction To Big Dat1
No ratings yet
Introduction To Big Dat1
6 pages
CT 2
No ratings yet
CT 2
8 pages
Big Data Complete Notes
100% (3)
Big Data Complete Notes
33 pages
Big Data Insights for Tech Professionals
No ratings yet
Big Data Insights for Tech Professionals
16 pages
Unit1 - BDH
No ratings yet
Unit1 - BDH
77 pages
BIG DATA Notes
No ratings yet
BIG DATA Notes
11 pages
Unit 4
No ratings yet
Unit 4
60 pages
1 Introduction To Big Data Management and Processing
No ratings yet
1 Introduction To Big Data Management and Processing
42 pages
Types of Digital Data: Unit 1 Big Data KCS-061
No ratings yet
Types of Digital Data: Unit 1 Big Data KCS-061
12 pages
Understanding Big Data and Hadoop Basics
No ratings yet
Understanding Big Data and Hadoop Basics
17 pages
TIE - 21CS71 SIMP With Key Answers
No ratings yet
TIE - 21CS71 SIMP With Key Answers
19 pages
2892 ArticleText 18886 3 10 20191006
No ratings yet
2892 ArticleText 18886 3 10 20191006
14 pages
BIG Data Analytics 21CSH-471: Computer Science & Engineering
No ratings yet
BIG Data Analytics 21CSH-471: Computer Science & Engineering
24 pages
Hadoop for Scalable Data Management
No ratings yet
Hadoop for Scalable Data Management
58 pages
Discussion Forum 4
No ratings yet
Discussion Forum 4
2 pages
Big Data Analytics - Unit 2
No ratings yet
Big Data Analytics - Unit 2
10 pages
Comprehensive Data Engineer Guide
No ratings yet
Comprehensive Data Engineer Guide
6 pages
Big Data Analytics
100% (1)
Big Data Analytics
14 pages
Big Data Analytics with Apache Hadoop
No ratings yet
Big Data Analytics with Apache Hadoop
33 pages
Big Data Processing: Speed & Efficiency
No ratings yet
Big Data Processing: Speed & Efficiency
28 pages
BigDataProcessingTools HaddopHDFSHiveSpark
No ratings yet
BigDataProcessingTools HaddopHDFSHiveSpark
2 pages
Dhan Singh Big Data File - 4
No ratings yet
Dhan Singh Big Data File - 4
1 page
Big Data Lab Manual
No ratings yet
Big Data Lab Manual
36 pages
Top 4 Open Source Tools You Can Use To Handle Big Data
No ratings yet
Top 4 Open Source Tools You Can Use To Handle Big Data
64 pages
J Ijdsa 20241005 11
No ratings yet
J Ijdsa 20241005 11
14 pages
Bangladesh University of Professionals: Submitted by Submitted To ID: Section: Batch
No ratings yet
Bangladesh University of Professionals: Submitted by Submitted To ID: Section: Batch
6 pages
Big Data Processing Techniques
No ratings yet
Big Data Processing Techniques
21 pages
Big Data Analytics
No ratings yet
Big Data Analytics
49 pages
Big Data Analytics Unit-1
100% (2)
Big Data Analytics Unit-1
5 pages
BDA1-4 Bunits
No ratings yet
BDA1-4 Bunits
113 pages
Introduction To Big Data
No ratings yet
Introduction To Big Data
153 pages
Karthiayinidva Notes
No ratings yet
Karthiayinidva Notes
29 pages
Big Data Analytics Overview and Tools
No ratings yet
Big Data Analytics Overview and Tools
38 pages
HAWQ: A Massively Parallel Processing SQL Engine in Hadoop: Pivotal Inc
No ratings yet
HAWQ: A Massively Parallel Processing SQL Engine in Hadoop: Pivotal Inc
12 pages
Unit 5
No ratings yet
Unit 5
14 pages
Survey of Big Data Analysis
No ratings yet
Survey of Big Data Analysis
2 pages
Analyzing and Processing Data Faster Bas PDF
No ratings yet
Analyzing and Processing Data Faster Bas PDF
6 pages
Top Big Data Platforms & Use Cases
No ratings yet
Top Big Data Platforms & Use Cases
9 pages
Big Data Integration and Processing 15 Marks
No ratings yet
Big Data Integration and Processing 15 Marks
5 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Big Data: Insight: Mrs. S.V. Balshetwar, Dr. R.M.Tugnayat
No ratings yet
Big Data: Insight: Mrs. S.V. Balshetwar, Dr. R.M.Tugnayat
3 pages
UNIT-3 - Technologies For Handling Big Data
No ratings yet
UNIT-3 - Technologies For Handling Big Data
21 pages
Big Data Analytics 1-5
100% (1)
Big Data Analytics 1-5
63 pages
Nosql
No ratings yet
Nosql
44 pages
Big Data 2.0 Processing Systems 2ed
No ratings yet
Big Data 2.0 Processing Systems 2ed
155 pages
Hortonworks Data Platform (HDP)
100% (1)
Hortonworks Data Platform (HDP)
56 pages
Spark Development for Developers
No ratings yet
Spark Development for Developers
172 pages
Big Data
No ratings yet
Big Data
10 pages
Module 4 - Entity Relationship (ER) Modeling
No ratings yet
Module 4 - Entity Relationship (ER) Modeling
13 pages
Understanding Unix File Permissions
No ratings yet
Understanding Unix File Permissions
7 pages
Bisample RPD
No ratings yet
Bisample RPD
360 pages
AI Sectoral Report Feb2024
No ratings yet
AI Sectoral Report Feb2024
44 pages
PHS 301 HEALTH MANAGEMENT INFORMATION SYSTEM - Teacher - Co - .Ke
No ratings yet
PHS 301 HEALTH MANAGEMENT INFORMATION SYSTEM - Teacher - Co - .Ke
90 pages
Proposal AIM MIA 2025 2027
No ratings yet
Proposal AIM MIA 2025 2027
17 pages
History of Dbms
No ratings yet
History of Dbms
9 pages
CP 340 Manual
No ratings yet
CP 340 Manual
212 pages
Twitter Data Extraction with Flume
No ratings yet
Twitter Data Extraction with Flume
2 pages
Chapter 2 - Developing Research Skills
No ratings yet
Chapter 2 - Developing Research Skills
13 pages
Practice 33 - Using SQL Tuning Health-Check Script (SQLHC)
No ratings yet
Practice 33 - Using SQL Tuning Health-Check Script (SQLHC)
2 pages
Indexing and Hashing Techniques
No ratings yet
Indexing and Hashing Techniques
88 pages
Course Title: Data Mining: Ashutosh Pandey 9873027274 (Whatsapp) Ashutosh - Pandey@wilp - Bits-Pilani - Ac.in
No ratings yet
Course Title: Data Mining: Ashutosh Pandey 9873027274 (Whatsapp) Ashutosh - Pandey@wilp - Bits-Pilani - Ac.in
8 pages
MIS: Uses and Challenges in Organizations
No ratings yet
MIS: Uses and Challenges in Organizations
3 pages
Data Collection Methods in Research
No ratings yet
Data Collection Methods in Research
9 pages
XML Notes
No ratings yet
XML Notes
12 pages
Teradata BTEQ and MultiLoad Guide
No ratings yet
Teradata BTEQ and MultiLoad Guide
49 pages
Agave Strategic Partners
No ratings yet
Agave Strategic Partners
16 pages
Becs-184 Question Paper
No ratings yet
Becs-184 Question Paper
12 pages
IGCSE ICT Week 9: Storage Devices
No ratings yet
IGCSE ICT Week 9: Storage Devices
6 pages
Mittmann Et Al 2021 Tiktok Is My Life and Snapchat Is My Ventricle A Mixed Methods Study On The Role of Online
No ratings yet
Mittmann Et Al 2021 Tiktok Is My Life and Snapchat Is My Ventricle A Mixed Methods Study On The Role of Online
32 pages
iSCSI Server Setup in RHEL 6.x Guide
No ratings yet
iSCSI Server Setup in RHEL 6.x Guide
6 pages
DFD Common Mistake
100% (2)
DFD Common Mistake
14 pages
Snowflake SnowPro Core Certification Exam Questions - Page 26 of 27 - SkillCertPro
No ratings yet
Snowflake SnowPro Core Certification Exam Questions - Page 26 of 27 - SkillCertPro
1 page
The Impact of Small Scale Business On The Economy Development in Ilorin
No ratings yet
The Impact of Small Scale Business On The Economy Development in Ilorin
15 pages
Question Bank For DM
No ratings yet
Question Bank For DM
4 pages
Data Fusion Methodology and Applications Marina Cocchi PDF Download
No ratings yet
Data Fusion Methodology and Applications Marina Cocchi PDF Download
162 pages
The EU GDPR - A Practical Guide - Paul Voigt PDF
100% (6)
The EU GDPR - A Practical Guide - Paul Voigt PDF
385 pages
HSC ICT Sheet Chapter 02
50% (2)
HSC ICT Sheet Chapter 02
31 pages
BCA Dot Net & SQL Project - Construction Building Cost Estimator - PDF Report With Source Cod..
No ratings yet
BCA Dot Net & SQL Project - Construction Building Cost Estimator - PDF Report With Source Cod..
109 pages

Written Assignment 4

Uploaded by

Written Assignment 4

Uploaded by

CS-3440-01 -AY2025-T4

Querying Techniques for Big Data: Benefits and Implementation in Organizations

benefit organizations: SQL-on-Hadoop, NoSQL querying, and stream processing querying. It

operations, and customer engagement.

to write complex queries over massive datasets.

computation, which reduces query execution time significantly.

unstructured or semi-structured data. These databases -- such as MongoDB, Cassandra, and

faster reads/writes, and easy schema evolution.

manage product catalogs, customer interactions, and recommendations based on real-time

immediate insight and response.

Organizations apply stream processing techniques in domains such as cybersecurity, fraud

enhances customer satisfaction through timely communication and decision-making.

The three querying techniques—SQL-on-Hadoop, NoSQL querying, and stream processing --

framework: Advantages and limitations. International Journal of Computer Sciences and

Engineering, 5(12), 305–312. https://www.researchgate.net/publication/322550872

Fuzzy Systems, 30(6), 1823–1837. https://ieeexplore.ieee.org/document/9388934

You might also like