0% found this document useful (0 votes)

13 views4 pages

Big Data Analytics&Visualization Syllabus

BigDataAnalytics&VisualizationSyllabus

Uploaded by

Soham Purao

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views4 pages

Big Data Analytics&Visualization Syllabus

BigDataAnalytics&VisualizationSyllabus

Uploaded by

Soham Purao

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Syllabus

MCA, Sem. III

Course Code Course Name

MCA31 Big Data Analytics and Visualization
Teaching Scheme:
Credits Assigned
Contact Hours (Per Week)
Theory Tutorial Total Theory Tutorial Total
3 - 3 3 - 3
Examination Scheme (Marks)
Internal Assessment (IA)
End Sem. Term Total
Continuous Total (IA) Examination Work (Marks)
Test
Assessment CA) (CA + Test)
25 25 50 50 - 100

Pre-requisite:
Some prior knowledge about SQL, DBMS would be beneficial.

Course Objectives: Course aim to

Sr. No. Course Objective

1 • Provide an overview of exciting and growing field of big data analytics
2 Enchase the programming skills using big data technologies such as map reduce,
NoSQL, Hive, Pig
3 Use Spark shell and Spark applications to explore, process, and analyze distributed data
4 Teach the component of visualization and understand why visualization is important for
data analysis

Course Outcomes (CO): On successful completion of course learner/student will be able to

Sr.
Course Outcome Bloom Level
No.
Demonstrate the key issues in big data management and its associated
CO1 application for business decision Understanding

Develop problem solving and critical thinking skills in fundamental

CO2 enabling technique using Map Reduce. Applying

Build problem-solving and critical thinking abilities through

CO3 fundamental enabling technologies like NoSQL and the Hadoop Creating
ecosystem.
CO4 Use of RDD and Data Frame to create Application in Spark. Applying
Evaluate the suitability of various visualization methods in exploratory
CO5 data analysis Evaluating
Course Contents:

Module Detailed Contents Hrs. CO Ref

No. No. No.
1 Introduction to Big Data: 6 CO1 1,2,3,
Introduction to Big Data, Big Data characteristics, Types of 4
Big Data, Traditional vs. Big Data, Big Data Applications.

Hadoop: Hadoop architecture, Hadoop Ecosystem.

HDFS: HDFS architecture, Features of HDFS, Rack

Awareness, HDFS Federation.

YARN architecture.

Self-Learning Topics: Google Cloud Dataproc, Azure

HDInsight.
2 Map Reduce: The Map Task, The Reduce Task, Grouping 6 CO2 1,2,3,
by Key, Partitioner and Combiners, Detail of Map Reduce 4
Execution.

Algorithm Using Map Reduce:

Matrix and Vector Multiplication by Map Reduce
Computing Selection and Projection by Map Reduce
Computing Grouping and Aggregation by Map Reduce

Self-Learning Topics: Concept of Sorting and Natural

Joins
3 NoSQL: 5 CO3 9
Introduction to NoSQL, No SQL Business drivers
NoSQL Data architecture patterns: key value stores, Column
family Stores, Graph Stores, Document Stores.
NoSQL to manage big data: Analyzing big data with shared
nothing architecture, choosing distribution master slave vs.
peer to peer. HBASE overview, HBASE data model, Read
Write architecture.
Self-Learning Topics: Cassandra Case Study
4 Hadoop Ecosystem: HIVE and PIG 6 CO3 10,11
HIVE: background, architecture, warehouse directory and
meta-store, HIVE query language, loading data into table,
HIVE built-in functions, joins in HIVE, Partitioning.

HiveQL: querying data, sorting and aggregation.

PIG: background, architecture, PIG Latin Basics, PIG

execution modes, PIG processing – loading and
transforming data, PIG built-in functions, filtering,
grouping, sorting data, PIG Latin commands.
Self-Learning Topics: Cloudera IMPALA
5 Apache Kafka: Kafka Fundamentals, Kafka architecture, 9 CO4 5,6,7
Case Study: Streaming real time data (Read Twitter Feeds
and Extract the Hashtags)
Module Detailed Contents Hrs. CO Ref
No. No. No.
Apache Spark:
Spark Basics, working with RDDs in Spark, Spark
Framework, aggregating Data with Pair RDDs, Writing and
Deploying Spark Applications, Spark SQL and Data
Frames.
Self-Learning Topics: pyspark, Apache Flink
6 Data Visualization: Explanation of data visualization, 8 CO5 8
Challenges of big data visualization, Approaches to big data
visualization, D3 and big data, Getting started with D3,
Another twist on bar chart visualizations.
Self-Learning Topics: PowerBI

Reference Books:
Reference Reference Name
No
1 Tom White, “HADOOP: The definitive Guide” O Reilly 2012, Third Edition,
ISBN: 978-1-449-31152-0
2 Chuck Lam, “Hadoop in Action”, Dreamtech Press 2016, First Edition
,ISBN:13 9788177228137
3 Shiva Achari,” Hadoop Essential “ PACKT Publications, ISBN 978-1-78439-
668-8
4 RadhaShankarmani and M. Vijayalakshmi ,”Big Data Analytics “Wiley
Textbook Series, Second Edition, ISBN 9788126565757
5 Neha Narkhede, Gwen Shapira, Todd Palino, “Kafka: The Definitive Guide”
O'Reilly, 2017, ISBN: 978-1-491-93516-0.
6 Jeffrey Aven,”Apache Spark in 24 Hours” Sam’s Publication, First Edition,
ISBN: 0672338513
7 Bill Chambers and MateiZaharia,”Spark: The Definitive Guide: Big Data
Processing Made Simple “O’Reilly Media; First edition, ISBN-10:1491912219
8 James D. Miller,” Big Data Visualization” PACKT Publications.ISBN-
10: 1785281941
9 Shashank Tiwari,“Professional NoSQL” Wrox, 2011, ISBN:978-0-470-94224-6.
10 Alan Gates, “Programming Pig” O'Reilly, 2011, ISBN: 978-1-449-30523-9.
11 Dean Wampler, Jason Rutherglen, Edward Capriolo, “Programming Hive”
O'Reilly, 2012, ISBN: 978-1-449-32248-9.

Web References:
Reference Reference Name
No
1 https://hadoop.apache.org/docs/stable/
2 https://pig.apache.org/
3 https://hive.apache.org/
4 https://www.ibm.com/think/topics/nosql-databases
5 https://spark.apache.org/documentation.html
6 https://help.tableau.com/current/pro/desktop/en-us/default.htm
Assessment:

Continuous Assessment (CA): 25 marks

Following measures can be used for the continuous assessment as:

• Assignments / Quiz / Case studies / Presentations / Projects / Any other measure with the
permission of the Director/ Principal / HOD / Coordinator.
• The continuous evaluation has to be done throughout the Semester.
• The faculty can use the flexibility of the mode as per the requirement of the course.

Test: 25 marks
• Assessment consists of one class tests of 25 marks.
• The class test is to be conducted when approx. 40 -50% of the syllabus is completed.
• Duration of the class test shall be one hour.

Internal Assessment (IA): 50 marks

• The Internal Assessment marks (out of 50) will be the total of the class test and the
continuous assessment.

End Semester Theory Examination:

1. Question paper will comprise of total 05 questions.
2. First question carrying 20 marks and remaining 4 carrying 15 marks each.
3. Total 03 questions (Including first question) need to be solved.
4. Question No: 01 will be compulsory and based on the entire syllabus wherein 4 sub-questions
of 5 marks each will be asked.
5. Remaining questions will be randomly selected from all the modules.
6. First question will be compulsory and Students can attempt any two from the remaining four
questions.
7. Weightage of each module will be proportional to the number of respective lecture hours as
mentioned in the syllabus.

2024 25 ODD CE449 BDA Syllabus
No ratings yet
2024 25 ODD CE449 BDA Syllabus
4 pages
Syllabus
No ratings yet
Syllabus
7 pages
113 Ce 74
No ratings yet
113 Ce 74
4 pages
The Ultimate Hands-On Hadoop - Tame Your Big Data!: What You'll Learn
No ratings yet
The Ultimate Hands-On Hadoop - Tame Your Big Data!: What You'll Learn
1 page
6th Sem - Big Data - IsE
No ratings yet
6th Sem - Big Data - IsE
5 pages
Big Data Curriculum for CS & CSE Students
No ratings yet
Big Data Curriculum for CS & CSE Students
2 pages
Big Data 2024
No ratings yet
Big Data 2024
3 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
4 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
4 pages
Syllabus - de
No ratings yet
Syllabus - de
3 pages
Big Data Course Overview and Insights
No ratings yet
Big Data Course Overview and Insights
7 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
4 pages
Big Data Management Syllabus
100% (1)
Big Data Management Syllabus
5 pages
22cs702 Data Analytics Unit-2.Dcm
No ratings yet
22cs702 Data Analytics Unit-2.Dcm
73 pages
Big Data Systems Course Overview
No ratings yet
Big Data Systems Course Overview
6 pages
Ccs334 Big Data Analytics
0% (1)
Ccs334 Big Data Analytics
2 pages
Big Data Analytics Syllabus
No ratings yet
Big Data Analytics Syllabus
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
Data Mining and Visualization
No ratings yet
Data Mining and Visualization
18 pages
Syllabus New Wal
No ratings yet
Syllabus New Wal
5 pages
Ccs334 - Big Data Analytics
60% (5)
Ccs334 - Big Data Analytics
2 pages
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
No ratings yet
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
3 pages
MCA 3rd Semester Big Data Analytics Syllabus
No ratings yet
MCA 3rd Semester Big Data Analytics Syllabus
15 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
Big Data
No ratings yet
Big Data
2 pages
714 Aids
No ratings yet
714 Aids
24 pages
714 Cseiml
No ratings yet
714 Cseiml
28 pages
2CS702-CPD-Odd 23 24
No ratings yet
2CS702-CPD-Odd 23 24
9 pages
IE494 - Big - Data - Processing - Course - File - Autumn24 - PMJ - PM Jat
No ratings yet
IE494 - Big - Data - Processing - Course - File - Autumn24 - PMJ - PM Jat
5 pages
BCS714D Syllabus
No ratings yet
BCS714D Syllabus
3 pages
Big Data Training in Chennai - Big Data Course in Chennai
No ratings yet
Big Data Training in Chennai - Big Data Course in Chennai
1 page
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
BDA Lesson Plan Final
No ratings yet
BDA Lesson Plan Final
20 pages
BDA Syllabus Final
No ratings yet
BDA Syllabus Final
3 pages
PCAC2009
No ratings yet
PCAC2009
3 pages
Big Data Analytics Course Plan 2023-24
No ratings yet
Big Data Analytics Course Plan 2023-24
19 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
Bda 23456789010
No ratings yet
Bda 23456789010
7 pages
DSA Practical Index
No ratings yet
DSA Practical Index
3 pages
Syllabus PDF
No ratings yet
Syllabus PDF
2 pages
Int 421
No ratings yet
Int 421
2 pages
Experiment Pgno
No ratings yet
Experiment Pgno
50 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
Unit 1
No ratings yet
Unit 1
19 pages
Big Data Analytics for B.Tech Students
No ratings yet
Big Data Analytics for B.Tech Students
119 pages
Big Data Analytics-Digital Notes
No ratings yet
Big Data Analytics-Digital Notes
86 pages
Course Pack BDA
No ratings yet
Course Pack BDA
6 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
No SQL Database in Bda
No ratings yet
No SQL Database in Bda
84 pages
LP BigData
No ratings yet
LP BigData
5 pages
17cs17 - Vcs314 - Big Data Systems
No ratings yet
17cs17 - Vcs314 - Big Data Systems
5 pages
Introduction To Data Analytics Syllabus
No ratings yet
Introduction To Data Analytics Syllabus
3 pages
Bigdata
No ratings yet
Bigdata
2 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
5 pages
Performance Testing Guidelines
No ratings yet
Performance Testing Guidelines
18 pages
SAPQA
No ratings yet
SAPQA
2 pages
Backend Development Roadmap For Python
No ratings yet
Backend Development Roadmap For Python
7 pages
Power BI Interview Questions Guide
No ratings yet
Power BI Interview Questions Guide
29 pages
Query Processing and Optimization Techniques
No ratings yet
Query Processing and Optimization Techniques
20 pages
DMS-ALL Chapterwise Questions
No ratings yet
DMS-ALL Chapterwise Questions
3 pages
DBMS Unit-4
67% (3)
DBMS Unit-4
67 pages
(Ebook) SAP ASE 16/sybase ASE Administration by Jeffrey Garbus ISBN 9781592299690, 1592299695 Instant Download
100% (1)
(Ebook) SAP ASE 16/sybase ASE Administration by Jeffrey Garbus ISBN 9781592299690, 1592299695 Instant Download
49 pages
RDBMS Overview for Database Management
No ratings yet
RDBMS Overview for Database Management
21 pages
SQL Server DBA Notes (Legacy)
No ratings yet
SQL Server DBA Notes (Legacy)
299 pages
Machine 2
No ratings yet
Machine 2
3 pages
Database Concepts & SQL Overview
No ratings yet
Database Concepts & SQL Overview
3 pages
Advanced Query Optimization
No ratings yet
Advanced Query Optimization
42 pages
Lab 5
No ratings yet
Lab 5
9 pages
Database System Final Project
No ratings yet
Database System Final Project
3 pages
SQL DBX
No ratings yet
SQL DBX
74 pages
Advanced SQL Commands Overview
No ratings yet
Advanced SQL Commands Overview
15 pages
Building An AI Agent For Automated Data Cleaning
No ratings yet
Building An AI Agent For Automated Data Cleaning
21 pages
Resume-Priyanka Bhutada
No ratings yet
Resume-Priyanka Bhutada
1 page
Advance Database System Ch.1 (Autosaved)
No ratings yet
Advance Database System Ch.1 (Autosaved)
40 pages
Unit I - 1.3 - Datasets For Machine Learning at CSJMU - 6 Slides Handouts
No ratings yet
Unit I - 1.3 - Datasets For Machine Learning at CSJMU - 6 Slides Handouts
2 pages
BN25C02 - Data Management & Data Engineering - Lecture Notes - Anna University - MBA (AI & DS)
No ratings yet
BN25C02 - Data Management & Data Engineering - Lecture Notes - Anna University - MBA (AI & DS)
219 pages
Questions On OS and DB - With Answer
No ratings yet
Questions On OS and DB - With Answer
4 pages
20 - Join in SQL
No ratings yet
20 - Join in SQL
6 pages
Building A Data Strategy - Practical Steps For Aligning With Business Goals
No ratings yet
Building A Data Strategy - Practical Steps For Aligning With Business Goals
43 pages
Updated - BSC III and IV Sem SEP Syllabus
No ratings yet
Updated - BSC III and IV Sem SEP Syllabus
12 pages
Lab02 DB
No ratings yet
Lab02 DB
3 pages
Natural PG
No ratings yet
Natural PG
528 pages
Trupti Shah
No ratings yet
Trupti Shah
5 pages
Data Warehousing - Metadata Concepts
No ratings yet
Data Warehousing - Metadata Concepts
9 pages

Big Data Analytics&Visualization Syllabus

Uploaded by

Big Data Analytics&Visualization Syllabus

Uploaded by

Syllabus

MCA, Sem. III

Course Code Course Name

Course Objectives: Course aim to

Sr. No. Course Objective

Course Outcomes (CO): On successful completion of course learner/student will be able to

Develop problem solving and critical thinking skills in fundamental

Build problem-solving and critical thinking abilities through

Module Detailed Contents Hrs. CO Ref

Hadoop: Hadoop architecture, Hadoop Ecosystem.

HDFS: HDFS architecture, Features of HDFS, Rack

Self-Learning Topics: Google Cloud Dataproc, Azure

Algorithm Using Map Reduce:

Self-Learning Topics: Concept of Sorting and Natural

HiveQL: querying data, sorting and aggregation.

PIG: background, architecture, PIG Latin Basics, PIG

Continuous Assessment (CA): 25 marks

Following measures can be used for the continuous assessment as:

Internal Assessment (IA): 50 marks

End Semester Theory Examination:

You might also like