Web Mining Syllabus

Uploaded by

nickybing781

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

153 views2 pages

Web Mining Syllabus

Uploaded by

nickybing781

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Web Mining

Course Code: Year: IV Semester: VI

Prerequisites: Data Mining, Machine Learning, Database Systems

Course Description

This course introduces students to the field of web mining, which involves the application of data mining
techniques to discover patterns from the World Wide Web. Students will learn to extract and analyze web
data including content, structure, and usage, using machine learning and natural language processing
techniques.

Course Objectives

1. To understand the fundamental concepts, scope, and types of web mining.

2. To analyze and process web content using text mining and natural language processing.
3. To explore the structure of the web through graph-based techniques and link analysis.
4. To model user behavior through web usage data and apply it in building intelligent systems.

Course Outcomes

Upon successful completion of this course, students will be able to:

CO1: Distinguish between content, structure, and usage-based web mining techniques.
CO2: Apply text and semantic analysis techniques for mining web content.
CO3: Analyze and rank websites using structural and link analysis algorithms.
CO4: Develop models for predicting user behavior and generating recommendations from web usage data.

Syllabus
(10 hours)
Unit I: Foundations of Web Mining and Web Data: Introduction to Data Mining and Web Mining, Web
Mining Taxonomy: Web Content Mining, Web Structure Mining, and Web Usage Mining, Web Data Types:
Structured, Semi-structured (HTML, XML), Unstructured (text, images), Web Crawling: Architecture,
Politeness Policies, Robots.txt, Indexing and Search Engines: Basic Concepts and Architecture.
(12 hours)
Unit II: Web Content Mining and Text Analytics: Text Mining Pipeline: Tokenization, Stop-word Removal,
Stemming and Lemmatization, Information Retrieval: Vector Space Model, TF-IDF, Cosine Similarity,
Document Classification and Clustering, Advanced Text Analytics: Named Entity Recognition (NER), Topic
Modeling (LDA), Sentiment Analysis and Opinion Mining.
(10 hours)

Unit III: Web Structure Mining and Link Analysis: Web Graph Modeling: Nodes, Edges, Hyperlink
Structure, Link Analysis Algorithms: PageRank, HITS, Community Detection: Identifying Web
Communities, Authority and Hub Nodes, Social Network Analysis Basics: Degree, Centrality, Clustering
Coefficient.
(12 hours)

Unit IV: Web Usage Mining and Personalization: Web Log Files: Formats, Parsing, Data Cleaning, User
Identification and Sessionization, Pattern Discovery: Sequential Pattern Mining, Association Rules, User
Profiling and Personalization, Introduction to Recommendation Systems: Collaborative Filtering,
Content-based Filtering.

Textbooks:
1. Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, Springer.
2. Charu C. Aggarwal, Mining the Web: Discovering Knowledge from Hypertext Data, Springer.

Reference Books:
1. Matthew Russell, Mining the Social Web, O'Reilly Media.
2. Christopher D. Manning, Introduction to Information Retrieval, Cambridge University Press.

Software & Tools:

Python Libraries: NLTK, Scikit-learn, BeautifulSoup, NetworkX, WEKA, Elasticsearch and Kibana.

Course Plan For Web Mining
No ratings yet
Course Plan For Web Mining
8 pages
Web Mining
No ratings yet
Web Mining
10 pages
WDM - 116AT02 Syllabus (GTURanker - Org)
No ratings yet
WDM - 116AT02 Syllabus (GTURanker - Org)
3 pages
Outline - Advanced Analytics 2017-19
No ratings yet
Outline - Advanced Analytics 2017-19
2 pages
MCA420 - Data and Web Mining
No ratings yet
MCA420 - Data and Web Mining
3 pages
Sma Unit 2
No ratings yet
Sma Unit 2
18 pages
Sma U-2
No ratings yet
Sma U-2
19 pages
II Sem Syllabus
No ratings yet
II Sem Syllabus
8 pages
Gujarat Technological University: Computer Engineering Web Data Management B.E. 8 Semester
No ratings yet
Gujarat Technological University: Computer Engineering Web Data Management B.E. 8 Semester
3 pages
Web Mining: Techniques and Applications
No ratings yet
Web Mining: Techniques and Applications
20 pages
Business Data Mining Long
No ratings yet
Business Data Mining Long
4 pages
Web Mining Techniques Overview
No ratings yet
Web Mining Techniques Overview
28 pages
Information Retrieval Techniques Syllabus
No ratings yet
Information Retrieval Techniques Syllabus
2 pages
Web Mining
No ratings yet
Web Mining
73 pages
13-Web Mining
No ratings yet
13-Web Mining
3 pages
BTech - CSE - 7thsem - Syllabus For Website
No ratings yet
BTech - CSE - 7thsem - Syllabus For Website
21 pages
Web Mining Research Overview
No ratings yet
Web Mining Research Overview
34 pages
3RD Sem Syllabus
No ratings yet
3RD Sem Syllabus
10 pages
Advanced Text & Web Analytics
No ratings yet
Advanced Text & Web Analytics
4 pages
DS SEM 8 Curriculum
No ratings yet
DS SEM 8 Curriculum
3 pages
DM M5.1 Web Mining v3.11
No ratings yet
DM M5.1 Web Mining v3.11
114 pages
Atma Qbank CSBS
No ratings yet
Atma Qbank CSBS
8 pages
DWM Assignment 1: 1. Write Detailed Notes On The Following: - A. Web Content Mining
No ratings yet
DWM Assignment 1: 1. Write Detailed Notes On The Following: - A. Web Content Mining
10 pages
Business Data Mining Week 13
No ratings yet
Business Data Mining Week 13
15 pages
Web Development for Engineering Students
No ratings yet
Web Development for Engineering Students
2 pages
Web Data Mining Unit Wise Important Questions
No ratings yet
Web Data Mining Unit Wise Important Questions
2 pages
CH 6 Web Mining and Other Data Mining
No ratings yet
CH 6 Web Mining and Other Data Mining
19 pages
6th Sem Syllabus
No ratings yet
6th Sem Syllabus
13 pages
Web Mining: Presented By: Vikash Kumar
No ratings yet
Web Mining: Presented By: Vikash Kumar
24 pages
Web Mining U-1,2
No ratings yet
Web Mining U-1,2
15 pages
Autonomy - SEM VIII - Major-Minor-DataScience
No ratings yet
Autonomy - SEM VIII - Major-Minor-DataScience
4 pages
Web Mining: By:-Vineeta 8pgc18 M.Tech (II Semester)
No ratings yet
Web Mining: By:-Vineeta 8pgc18 M.Tech (II Semester)
33 pages
Overview of Web Mining Techniques
No ratings yet
Overview of Web Mining Techniques
41 pages
Dm-Unit Advanced Concepts
No ratings yet
Dm-Unit Advanced Concepts
57 pages
Live Classroom 1
No ratings yet
Live Classroom 1
30 pages
Process of Web Mining and Categories of Web Mining
No ratings yet
Process of Web Mining and Categories of Web Mining
5 pages
Cse3024 Web-Mining Eth 1.1 47 Cse3024 PDF
No ratings yet
Cse3024 Web-Mining Eth 1.1 47 Cse3024 PDF
12 pages
Web Mining
No ratings yet
Web Mining
13 pages
Web Mining 171317705012335496661d01dac5fa2
No ratings yet
Web Mining 171317705012335496661d01dac5fa2
48 pages
Web Mining Techniques and Challenges
No ratings yet
Web Mining Techniques and Challenges
42 pages
Module1PartAweb Mining-Intro
No ratings yet
Module1PartAweb Mining-Intro
28 pages
Overview of Web Mining Techniques
No ratings yet
Overview of Web Mining Techniques
28 pages
Data Mining
No ratings yet
Data Mining
10 pages
Web Crawler Assisted Web Page Cleaning For Web Data Mining
No ratings yet
Web Crawler Assisted Web Page Cleaning For Web Data Mining
75 pages
3rd Sem Syllabus
0% (1)
3rd Sem Syllabus
12 pages
Business Data Mining Course Overview
No ratings yet
Business Data Mining Course Overview
1 page
Three Areas of Web Mining Explained
No ratings yet
Three Areas of Web Mining Explained
37 pages
Web Usage Mining
No ratings yet
Web Usage Mining
13 pages
Unit I
No ratings yet
Unit I
11 pages
Web Mining Course Overview and Details
No ratings yet
Web Mining Course Overview and Details
4 pages
WE Lecture 01 Introduction
No ratings yet
WE Lecture 01 Introduction
36 pages
Web Mining Techniques Overview
No ratings yet
Web Mining Techniques Overview
20 pages
Web Mining and Text Mining
No ratings yet
Web Mining and Text Mining
65 pages
Data Mining
No ratings yet
Data Mining
12 pages
Unit 3 Web
No ratings yet
Unit 3 Web
81 pages
Web Mining
100% (3)
Web Mining
28 pages
Sen 935
No ratings yet
Sen 935
4 pages
Recoverability in DBMS
No ratings yet
Recoverability in DBMS
6 pages
Uog-Model-Question Update
No ratings yet
Uog-Model-Question Update
139 pages
DDCT Method For QRT-PCR Data Analysis
No ratings yet
DDCT Method For QRT-PCR Data Analysis
8 pages
.NG E-Exampastquestions E-Exams2017 Cit212.Htm
No ratings yet
.NG E-Exampastquestions E-Exams2017 Cit212.Htm
12 pages
Class 12 Computer Science Practical Guide
No ratings yet
Class 12 Computer Science Practical Guide
24 pages
pl-300 983fefa7c47d
No ratings yet
pl-300 983fefa7c47d
261 pages
Big Data Fabric Architecture
No ratings yet
Big Data Fabric Architecture
15 pages
Putaway Strategies in SAP WM
No ratings yet
Putaway Strategies in SAP WM
2 pages
Topic 1
No ratings yet
Topic 1
69 pages
Login&RegistrationModule (Soliman)
No ratings yet
Login&RegistrationModule (Soliman)
5 pages
Excel & Word Basics for Students
No ratings yet
Excel & Word Basics for Students
4 pages
PLSQL PPT 17
No ratings yet
PLSQL PPT 17
18 pages
Teja Resume SR Java Full Stack Developer
No ratings yet
Teja Resume SR Java Full Stack Developer
8 pages
Sanjana Data Engineer
100% (1)
Sanjana Data Engineer
4 pages
CS202 B wk13 L17L18 Ashah
No ratings yet
CS202 B wk13 L17L18 Ashah
67 pages
Res2dinv FR
No ratings yet
Res2dinv FR
2 pages
GIS-BIM Integration for Code Compliance
No ratings yet
GIS-BIM Integration for Code Compliance
15 pages
Advance Backend
No ratings yet
Advance Backend
1 page
COVID-19 Data Analysis Application
No ratings yet
COVID-19 Data Analysis Application
13 pages
Keys in DBMS
No ratings yet
Keys in DBMS
10 pages
Google App Engine
No ratings yet
Google App Engine
26 pages
SQL Injection: Risks and Defenses Guide
No ratings yet
SQL Injection: Risks and Defenses Guide
19 pages
Web Development Syllabus V2V Internship
No ratings yet
Web Development Syllabus V2V Internship
16 pages
Accenture Power BI Developer Interview Questions
No ratings yet
Accenture Power BI Developer Interview Questions
10 pages
PowerBuilder Multithreading Guide
No ratings yet
PowerBuilder Multithreading Guide
23 pages
Java, Android, Python Programming Curriculum
No ratings yet
Java, Android, Python Programming Curriculum
5 pages
File Structures for Students
No ratings yet
File Structures for Students
17 pages
Chapter 2 Statistical Estimation
No ratings yet
Chapter 2 Statistical Estimation
30 pages
Cymbal Ingest To Vector Database All Steps
No ratings yet
Cymbal Ingest To Vector Database All Steps
6 pages
SAP CRM Systems Engineer Resume
No ratings yet
SAP CRM Systems Engineer Resume
6 pages