Big Data Curriculum for CS & CSE Students

The document outlines the course structure for Big Data (BCS061) at Dr. A.P.J. Abdul Kalam Technical University, detailing course outcomes and Bloom's knowledge levels. It includes a comprehensive syllabus covering topics such as Big Data concepts, Hadoop, Map Reduce, NoSQL databases, and various frameworks like Hive and Pig. Additionally, it lists recommended textbooks and references for further study.

Uploaded by

abbaiqbal59

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

81 views2 pages

Big Data Curriculum for CS & CSE Students

Uploaded by

abbaiqbal59

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

DR. A.P.J.

ABDUL KALAM TECHNICAL UNIVERSITY, UTTAR PRADESH, LUCKNOW

Big Data (BCS061)
Course Outcome (CO) Bloom’s Knowledge Level (KL)

At the end of course , the student will be able to

CO 1 Demonstrate knowledge of Big Data Analytics concepts and its applications in business. K1,K2

CO 2 Demonstrate functions and components of Map Reduce Framework and HDFS. K1,K2

CO 3 Discuss Data Management concepts in NoSQL environment. K6

CO 4 Explain process of developing Map Reduce based distributed processing applications. K2,K5

CO 5 Explain process of developing applications using HBASE, Hive, Pig etc. K2,K5

DETAILED SYLLABUS 3-0-0

Unit Topic Proposed
Lectures
Introduction to Big Data: Types of digital data, history of Big Data innovation, introduction
to Big Data platform, drivers for Big Data, Big Data architecture and characteristics, 5 Vs of
Big Data, Big Data technology components, Big Data importance and applications, Big Data
I
features – security, compliance, auditing and protection, Big Data privacy and ethics, Big 06
Data Analytics, Challenges of conventional systems, intelligent data analysis, nature of data,
analytic processes and tools, analysis vs reporting,
modern data analytic tools.
Hadoop: History of Hadoop, Apache Hadoop, the Hadoop Distributed File System,
components of Hadoop, data format, analyzing data with Hadoop, scaling out, Hadoop
streaming, Hadoop pipes, Hadoop Echo System.
II 08
Map Reduce: Map Reduce framework and basics, how Map Reduce works, developing a
Map Reduce application, unit tests with MR unit, test data and local tests, anatomy of a Map
Reduce job run, failures, job scheduling, shuffle and sort, task execution, Map Reducetypes,
input formats, output formats, Map Reduce features, Real-world Map Reduce
HDFS (Hadoop Distributed File System): Design of HDFS, HDFS concepts, benefits and
challenges, file sizes, block sizes and block abstraction in HDFS, data replication, how does
HDFS store, read, and write files, Java interfaces to HDFS, command line interface, Hadoop
III file system interfaces, data flow, data ingest with Flume and Scoop, Hadoop archives, 08
Hadoop I/O: compression, serialization, Avro and file-based data structures.
Hadoop Environment: Setting up a Hadoop cluster, cluster specification, cluster setup
and installation, Hadoop configuration, security in Hadoop, administering Hadoop, HDFS
monitoring & maintenance, Hadoop benchmarks, Hadoop in the cloud
Hadoop Eco System and YARN: Hadoop ecosystem components, schedulers, fair and
capacity, Hadoop 2.0 New Features - NameNode high availability, HDFS federation,MRv2,
YARN, Running MRv1 in YARN.
NoSQL Databases: Introduction to NoSQL
IV MongoDB: Introduction, data types, creating, updating and deleing documents, querying, 09
introduction to indexing, capped collections
Spark: Installing spark, spark applications, jobs, stages and tasks, Resilient Distributed
Databases, anatomy of a Spark job run, Spark on YARN
SCALA: Introduction, classes and objects, basic types and operators, built-in control
structures, functions and closures, inheritance.
Hadoop Eco System Frameworks: Applications on Big Data using Pig, Hive and HBase
V 09
Pig - Introduction to PIG, Execution Modes of Pig, Comparison of Pig with Databases,
Grunt, Pig Latin, User Defined Functions, Data Processing operators,
Curriculum & Evaluation Scheme: CS, Computer Engineering and CSE (V & VI Semester) 26
DR. A.P.J. ABDUL KALAM TECHNICAL UNIVERSITY, UTTAR PRADESH, LUCKNOW
Hive - Apache Hive architecture and installation, Hive shell, Hive services, Hive metastore,
comparison with traditional databases, HiveQL, tables, querying data and user defined
functions, sorting and aggregating, Map Reduce scripts, joins & subqueries.
HBase – Hbase concepts, clients, example, Hbase vs RDBMS, advanced usage, schema
design, advance indexing, Zookeeper – how it helps in monitoring a cluster, how to build
applications with Zookeeper.
IBM Big Data strategy, introduction to Infosphere, BigInsights and Big Sheets, introduction
to Big SQL.
Text books and References:
1. Michael Minelli, Michelle Chambers, and Ambiga Dhiraj, "Big Data, Big Analytics: Emerging Business
Intelligence and Analytic Trends for Today's Businesses", Wiley
2. DT Editorial Services, Big-Data Black Book, Wiley
3. Dirk deRoos, Chris Eaton, George Lapis, Paul Zikopoulos, Tom Deutsch, “Understanding Big Data Analytics for
Enterprise Class Hadoop and Streaming Data”, McGraw Hill.
4. Thomas Erl, Wajid Khattak, Paul Buhler, “Big Data Fundamentals: Concepts, Drivers and Techniques”, Prentice
Hall.
5. Bart Baesens “Analytics in a Big Data World: The Essential Guide to Data Science and its Applications (WILEY
Big Data Series)”, John Wiley & Sons
6. ArshdeepBahga, Vijay Madisetti, “Big Data Science & Analytics: A HandsOn Approach “, VPT
7. Anand Rajaraman and Jeffrey David Ullman, “Mining of Massive Datasets”, CUP
8. Tom White, "Hadoop: The Definitive Guide", O'Reilly.
9. Eric Sammer, "Hadoop Operations", O'Reilly.
10. Chuck Lam, “Hadoop in Action”, MANNING Publishers
11. Deepak Vohra, “Practical Hadoop Ecosystem: A Definitive Guide to Hadoop-Related Frameworks and Tools”,
Apress
12. E. Capriolo, D. Wampler, and J. Rutherglen, "Programming Hive", O'Reilly
13. Lars George, "HBase: The Definitive Guide", O'Reilly.
14. Alan Gates, "Programming Pig", O'Reilly.
15. Michael Berthold, David J. Hand, “Intelligent Data Analysis”, Springer
16. Bill Franks, “Taming the Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced
Analytics”, John Wiley & sons
17. Glenn J. Myatt, “Making Sense of Data”, John Wiley & Sons
18. Pete Warden, “Big Data Glossary”, O’Reilly

Curriculum & Evaluation Scheme: CS, Computer Engineering and CSE (V & VI Semester) 27

Koe097big Data
No ratings yet
Koe097big Data
1 page
LP BigData
No ratings yet
LP BigData
5 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
Big Data analyticsNEW SYLLABUS FRAMING
No ratings yet
Big Data analyticsNEW SYLLABUS FRAMING
3 pages
22IS61 Big Data Analytics 2025
No ratings yet
22IS61 Big Data Analytics 2025
4 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
No ratings yet
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
2 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
4 pages
Big Data and Hadoop For Developers - Syllabus
No ratings yet
Big Data and Hadoop For Developers - Syllabus
6 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
Big Data Analytics Syllabus
No ratings yet
Big Data Analytics Syllabus
3 pages
BDA Courseplan
No ratings yet
BDA Courseplan
3 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
24 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
119 pages
Unit 1
No ratings yet
Unit 1
19 pages
BDA Syllabus
No ratings yet
BDA Syllabus
2 pages
Big Data & Hadoop Course Overview
No ratings yet
Big Data & Hadoop Course Overview
3 pages
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
No ratings yet
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
131 pages
Big Data Analytics
No ratings yet
Big Data Analytics
61 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
134 pages
17cs17 - Vcs314 - Big Data Systems
No ratings yet
17cs17 - Vcs314 - Big Data Systems
5 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
2 pages
Syllabus
No ratings yet
Syllabus
3 pages
Introduction to Big Data with Hadoop
No ratings yet
Introduction to Big Data with Hadoop
3 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
MCAD2232 (PRESS) BIG DATA and Its Applications
No ratings yet
MCAD2232 (PRESS) BIG DATA and Its Applications
140 pages
Big Data Analytics
No ratings yet
Big Data Analytics
20 pages
22cs702 Data Analytics Unit-2.Dcm
No ratings yet
22cs702 Data Analytics Unit-2.Dcm
73 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
MCA - II Sem - Curriculum and Syllabus
No ratings yet
MCA - II Sem - Curriculum and Syllabus
15 pages
Syllabus Big Data Analytics
No ratings yet
Syllabus Big Data Analytics
2 pages
BigData and Hadoop - Syllabus
No ratings yet
BigData and Hadoop - Syllabus
2 pages
RMK Group Data Analytics Guide
No ratings yet
RMK Group Data Analytics Guide
72 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
Big Data and Hadoop Development Guide
No ratings yet
Big Data and Hadoop Development Guide
3 pages
Big Data Analytics Course
No ratings yet
Big Data Analytics Course
19 pages
Introduction To Data Analytics Syllabus
No ratings yet
Introduction To Data Analytics Syllabus
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Data Bots Training Courses
100% (1)
Data Bots Training Courses
36 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
4 pages
BCA - 409 Syallabus
No ratings yet
BCA - 409 Syallabus
2 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
BDA Course Plan
No ratings yet
BDA Course Plan
6 pages
GAME
No ratings yet
GAME
2 pages
Course Pack BDA
No ratings yet
Course Pack BDA
6 pages
Course Contents of Hadoop and Big Data
No ratings yet
Course Contents of Hadoop and Big Data
11 pages
20IT503 - Big Data Analytics - Unit4
No ratings yet
20IT503 - Big Data Analytics - Unit4
73 pages
Had Oop Details
No ratings yet
Had Oop Details
21 pages
Big Data
No ratings yet
Big Data
2 pages
BIG DATA ANALYTIS LAB File Shivam
No ratings yet
BIG DATA ANALYTIS LAB File Shivam
42 pages
AC141P111
No ratings yet
AC141P111
18 pages
AC141P110
No ratings yet
AC141P110
27 pages
E-Receipt: Samsung Axis Bank Credit Card 10% Extra Cashback Across Samsung Products & Services
No ratings yet
E-Receipt: Samsung Axis Bank Credit Card 10% Extra Cashback Across Samsung Products & Services
1 page
receiptPdfFile 20250803 053252
No ratings yet
receiptPdfFile 20250803 053252
1 page
Patient Report 07 2025
No ratings yet
Patient Report 07 2025
2 pages
Fee Verification Pending - Summer Internship
No ratings yet
Fee Verification Pending - Summer Internship
22 pages
SL - No Roll No. Candidates Name Branch/Course
No ratings yet
SL - No Roll No. Candidates Name Branch/Course
24 pages
Josh Technology Front End Developer Venue Details Slot 01 - Mail
No ratings yet
Josh Technology Front End Developer Venue Details Slot 01 - Mail
24 pages
Appointment Reciept SH
No ratings yet
Appointment Reciept SH
3 pages
Blood Overview
No ratings yet
Blood Overview
1 page
BTech Third & Fourth Year 2024-25 - Even Semester First Continuous Assessment Theory Examination (CATE-I)
No ratings yet
BTech Third & Fourth Year 2024-25 - Even Semester First Continuous Assessment Theory Examination (CATE-I)
1 page
Tech Expo-Akhil Jyot
No ratings yet
Tech Expo-Akhil Jyot
1 page
Stream Processing and Analysis Questions
No ratings yet
Stream Processing and Analysis Questions
2 pages
Explain Different Types of Data Structures and Their Applications
No ratings yet
Explain Different Types of Data Structures and Their Applications
11 pages
Secure Servers Hosted On Amazon Web Services (AWS) EC2 and ECS
No ratings yet
Secure Servers Hosted On Amazon Web Services (AWS) EC2 and ECS
2 pages
Add Custom Fields in SAP Pricing and Sales Order Item 1730093928
No ratings yet
Add Custom Fields in SAP Pricing and Sales Order Item 1730093928
6 pages
Class8 Ch-3 Quesans
No ratings yet
Class8 Ch-3 Quesans
2 pages
Ip Practice Questions Class 12
No ratings yet
Ip Practice Questions Class 12
5 pages
Experiment No 2
No ratings yet
Experiment No 2
6 pages
Activate Material Ledger in S/4 HANA
No ratings yet
Activate Material Ledger in S/4 HANA
11 pages
Chapter 3 Solutions
100% (5)
Chapter 3 Solutions
6 pages
SQL Database Management Techniques
No ratings yet
SQL Database Management Techniques
34 pages
SQL Modules
No ratings yet
SQL Modules
1 page
Reducing Downtime in SAP Basis Envi
No ratings yet
Reducing Downtime in SAP Basis Envi
2 pages
Chapter-5 Stream Processing Part1
No ratings yet
Chapter-5 Stream Processing Part1
32 pages
Activity Exercises
No ratings yet
Activity Exercises
4 pages
Unit-2 BCT
No ratings yet
Unit-2 BCT
22 pages
Machine Learning MCQs Set 1
No ratings yet
Machine Learning MCQs Set 1
5 pages
Unit - 4 - Transaction Processing
No ratings yet
Unit - 4 - Transaction Processing
12 pages
G7 - Unit 9 - Data & Data Representation
No ratings yet
G7 - Unit 9 - Data & Data Representation
17 pages
Assignment 3 Dang Vi Luan Nguyen Dinh Nhat Minh Vu Quoc Anh
No ratings yet
Assignment 3 Dang Vi Luan Nguyen Dinh Nhat Minh Vu Quoc Anh
13 pages
Image Processing in Multimedia Databases
No ratings yet
Image Processing in Multimedia Databases
58 pages
CS Paper 2 Questions
No ratings yet
CS Paper 2 Questions
105 pages
AZ-900 Microsoft Azure Fundamentals - Session - 2
100% (1)
AZ-900 Microsoft Azure Fundamentals - Session - 2
28 pages
Lab Manual Big Data
No ratings yet
Lab Manual Big Data
22 pages
ASP.NET MVC Data Handling Guide
No ratings yet
ASP.NET MVC Data Handling Guide
10 pages
Course 6231A: Maintaining A Microsoft SQL Server 2008 Database
No ratings yet
Course 6231A: Maintaining A Microsoft SQL Server 2008 Database
12 pages
Real-Time Streaming for Tech Pros
No ratings yet
Real-Time Streaming for Tech Pros
5 pages
Anant Resume
No ratings yet
Anant Resume
1 page
Spatial and Web Mining
No ratings yet
Spatial and Web Mining
27 pages
Suhana Kushwaha Resume
No ratings yet
Suhana Kushwaha Resume
2 pages
Para Distr Query Processing Notes
No ratings yet
Para Distr Query Processing Notes
7 pages

Big Data Curriculum for CS & CSE Students

Uploaded by

Big Data Curriculum for CS & CSE Students

Uploaded by

DR. A.P.J.

ABDUL KALAM TECHNICAL UNIVERSITY, UTTAR PRADESH, LUCKNOW

At the end of course , the student will be able to

CO 3 Discuss Data Management concepts in NoSQL environment. K6

DETAILED SYLLABUS 3-0-0

You might also like