0% found this document useful (0 votes)

22 views17 pages

2-Tasks and Techniques

Uploaded by

Anti Terrestrial Material

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views17 pages

2-Tasks and Techniques

Uploaded by

Anti Terrestrial Material

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Data Mining

Tasks and Techniques

Data Mining Tasks

Descriptive

Classi cation and Prediction

fi
Descriptive Function
• Deals with the general properties of data in the database.

➡ Class/Concept Description

➡ Mining of Frequent Pattern

➡ Mining of Associations

➡ Mining of Correlations

➡ Mining of Clusters
Descriptive Function
Class/Concept Description

• refers to the data to be associated with classes or concepts

• these descriptions can be derived in the following ways

➡ Data Characterization - refers to summarizing data of class under study. Class

understudy is called Target Class

➡ Data Discrimination - refers to the mapping or classi cation of a class with some
prede ned group or class
fi
fi
Descriptive Function
Mining of Frequent Patterns

• Frequent patterns occur in transactional data

➡ Frequent Item Set - refers to a set of items that frequently appear together

➡ Frequent Subsequence - a sequence of patterns that occur frequently such as

purchasing a camera is followed by memory card

➡ Frequent Sub Structure - sub structure refers to a different structural forms, such as
graphs, trees, or lattices, which may be combined with item-sets or subsequences
Descriptive Function
Mining of Associations

• Associations are used in retail to identify patterns that are frequently

purchased together.

• This process refer to the process of uncovering the relationship among data
and determining the association rules

• example: a retailer generates an association rule that shows that 70% of the
time milk is sold with bread and only 30% of the time biscuits are sold with
bread
Descriptive Function
Mining of Correlation

• It is a kind of additional analysis performed to uncover interesting statistical

correlation between associate-attribute-value pairs or between item sets to
analyze if they have positive, negative, or no effect on each other
Descriptive Function
Mining of Clusters

• Clusters refers to forming groups of objects that are very similar to each
other but are highly different from the objects in other clusters
Classi cation and Prediction
• Classi cation is the process of nding a model that describes the data into
classes or concepts

• The main purpose is to be able to use this model to predict class of objects
whose class label is unknown.

• The derived model is based on the analysis of sets of training data and can
be presented in the following forms:

Classification (If-Then) Rules

Decision Trees
Mathematical Formulae
Neural Networks
fi
fi
fi
Data Mining Techniques
Data mining includes utilization of re ned data analysis
tools to nd previously unknown, valid patterns and
relationships in huge data sets. These tools can
incorporate statistical model, machine learning
techniques, mathematical algorithms such as neural
networks and decision trees. Thus, data mining
incorporates analysis and prediction
fi
fi
Data Mining Techniques
• Classi cation
➡ This technique is used to obtain
important relevant information about
data and metadata

➡ This Data Mining technique helps

classify data in different classes
fi
Data Mining Techniques
• Clustering
➡ It is a division of information into groups
of connected objects

➡ Describing the data by a few clusters

mainly loses certain con ne details, but
accomplishes improvement. It model
data by clusters

➡ Clustering analysis is a data mining

technique to identify similar data
fi
Data Mining Techniques
• Regression
➡ Regression analysis is a data mining
process used to identify and analyze
relationship between variables because
of the presence of the other factor.

➡ Regression, primarily is a form of

planning and modeling

➡ it gives exact relationship between two

or more variables in the given data set
Data Mining Techniques
• Association Rules
➡ This is a technique that helps discover
the link between two or more items.

➡ It nds hidden pattern in the data set

➡ These are if-then statements that support

to show the probability of interactions
between data items within large data sets
in different types of database

➡ Association Rule mining has several

applications and is commonly used to
help sales correlation in data or medical
data sets
fi
Data Mining Techniques
• Outlier
➡ This technique relates to the observation
of data items in a data set, which do not
match an expected pattern or behavior

➡ This technique may be used in various

domains like intrusion, detection, fraud,
etc.

➡ Outlier is a data point that diverge too

much from the rest of the dataset

➡ It is valuable in elds like network

interruption, identi cation, credit or debit
fraud detection, etc.
fi
fi
Data Mining Techniques
• Sequential Patterns
➡ It is a data mining technique specialized
in evaluating sequential data to discover
sequential patterns

➡ It comprises of nding interesting

subsequences in a set of subsequence,
where the stake of a sequence can be
measured in terms of different criteria
like length, occurrence frequency, etc.

➡ This technique helps to discover or

recognize similar patterns in transaction
data over some time
fi
Data Mining Techniques
• Prediction
➡ This technique uses a combination of
other data mining technique such as
trends, clustering, classi cation, etc.

➡ It analyzes past events or instances in

the right sequence to predict future
events
fi

Data Mining Techniques
No ratings yet
Data Mining Techniques
24 pages
Data Mining: Techniques & Applications
No ratings yet
Data Mining: Techniques & Applications
21 pages
Comprehensive Data Mining Guide
No ratings yet
Comprehensive Data Mining Guide
52 pages
CSC 425 Data Mining and Warehousing 2024
No ratings yet
CSC 425 Data Mining and Warehousing 2024
54 pages
Data Mining Essentials for Analysts
No ratings yet
Data Mining Essentials for Analysts
73 pages
Fundamentals of Data Science Notes (Module - 1)
No ratings yet
Fundamentals of Data Science Notes (Module - 1)
19 pages
Understanding Data Mining Processes
No ratings yet
Understanding Data Mining Processes
6 pages
Knowledge Management UNIT-3 Notes
No ratings yet
Knowledge Management UNIT-3 Notes
17 pages
Data Mining: Techniques & Applications
No ratings yet
Data Mining: Techniques & Applications
38 pages
Data Mining
No ratings yet
Data Mining
6 pages
Data Mining
No ratings yet
Data Mining
35 pages
DWDM Unit-II Notes
No ratings yet
DWDM Unit-II Notes
29 pages
DM - Unit I-Updated
No ratings yet
DM - Unit I-Updated
65 pages
Data Mining Technique Using Weka Tool
No ratings yet
Data Mining Technique Using Weka Tool
21 pages
Tasks and Functionalities of Data Mining
No ratings yet
Tasks and Functionalities of Data Mining
3 pages
Data Mining Techniques and Applications
No ratings yet
Data Mining Techniques and Applications
16 pages
2 Data Mining Tasks A Functionalities
No ratings yet
2 Data Mining Tasks A Functionalities
24 pages
Unit 4 New Database Applications and Environments: by Bhupendra Singh Saud
No ratings yet
Unit 4 New Database Applications and Environments: by Bhupendra Singh Saud
14 pages
Data Characterization and Discrimination
No ratings yet
Data Characterization and Discrimination
4 pages
1.1 - Data Mining
No ratings yet
1.1 - Data Mining
18 pages
Data Mining Unit 1
No ratings yet
Data Mining Unit 1
24 pages
4 Datamining
No ratings yet
4 Datamining
90 pages
Unit 1 DM
No ratings yet
Unit 1 DM
24 pages
III-IT-Data Mining Unit 1-Session 2-Part1
No ratings yet
III-IT-Data Mining Unit 1-Session 2-Part1
17 pages
Lect 2
No ratings yet
Lect 2
35 pages
Module 4
No ratings yet
Module 4
54 pages
Seminar On Data Mining Concepts and Its
No ratings yet
Seminar On Data Mining Concepts and Its
8 pages
Data Mining
No ratings yet
Data Mining
4 pages
Unit 1
No ratings yet
Unit 1
59 pages
DATA MINIING Unit 1 Notes
No ratings yet
DATA MINIING Unit 1 Notes
22 pages
Unit 1 Data Mining
No ratings yet
Unit 1 Data Mining
30 pages
Week-1-Introduction To Data Mining
No ratings yet
Week-1-Introduction To Data Mining
43 pages
DM Unit 1
No ratings yet
DM Unit 1
10 pages
Data Mining
No ratings yet
Data Mining
22 pages
Data Mining Unit I Notes
No ratings yet
Data Mining Unit I Notes
24 pages
What Is Data Mining?
No ratings yet
What Is Data Mining?
17 pages
BCA Data Mining
No ratings yet
BCA Data Mining
116 pages
Data Mining Techniques and Applications
No ratings yet
Data Mining Techniques and Applications
39 pages
Data Mining Techniques Overview
No ratings yet
Data Mining Techniques Overview
15 pages
VO - MCA - S4 - Data Mining Unit 1
No ratings yet
VO - MCA - S4 - Data Mining Unit 1
18 pages
Introduction
No ratings yet
Introduction
26 pages
Overview of Data Mining Tasks
No ratings yet
Overview of Data Mining Tasks
24 pages
Introduction To Data Mining: Dr. Dipti Chauhan Assistant Professor SCSIT, SUAS Indore
No ratings yet
Introduction To Data Mining: Dr. Dipti Chauhan Assistant Professor SCSIT, SUAS Indore
16 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
6 pages
Data Mining Module - New
No ratings yet
Data Mining Module - New
38 pages
Data Mining-CH5
No ratings yet
Data Mining-CH5
49 pages
DM Notes Pra
No ratings yet
DM Notes Pra
63 pages
Data Mining for Beginners
No ratings yet
Data Mining for Beginners
26 pages
Understanding KDD in Data Mining
No ratings yet
Understanding KDD in Data Mining
20 pages
Unit
No ratings yet
Unit
27 pages
DM Lec1
No ratings yet
DM Lec1
14 pages
DM 1 PDF
No ratings yet
DM 1 PDF
67 pages
Intro to Data Mining Course Overview
No ratings yet
Intro to Data Mining Course Overview
62 pages
Data Mining Techniques Using R Unit 1
No ratings yet
Data Mining Techniques Using R Unit 1
26 pages
Data Mining: An Overview From A Database Perspective
No ratings yet
Data Mining: An Overview From A Database Perspective
30 pages
Fundamentals of Data Science Unit 1
No ratings yet
Fundamentals of Data Science Unit 1
29 pages
Unit 1: Scs5623 - Data Mining and Warehousing
No ratings yet
Unit 1: Scs5623 - Data Mining and Warehousing
13 pages
Data Mining
No ratings yet
Data Mining
25 pages
40N65H5 DS v02 - 01 EN PDF
No ratings yet
40N65H5 DS v02 - 01 EN PDF
18 pages
Modal Truncation in Cyclic Symmetry Analysis
No ratings yet
Modal Truncation in Cyclic Symmetry Analysis
12 pages
Printer-Friendly Grimdark Millennium - 40K Edition (Beta 18012025)
No ratings yet
Printer-Friendly Grimdark Millennium - 40K Edition (Beta 18012025)
35 pages
CN Notes
No ratings yet
CN Notes
246 pages
CSfC Data-at-Rest Capability V5.0
No ratings yet
CSfC Data-at-Rest Capability V5.0
84 pages
5G Antenna Design
No ratings yet
5G Antenna Design
78 pages
Digital Forensics Investigation Process
No ratings yet
Digital Forensics Investigation Process
5 pages
Four Levels of Validation
No ratings yet
Four Levels of Validation
47 pages
APSCL AE (Mech) Model Test Batch
No ratings yet
APSCL AE (Mech) Model Test Batch
3 pages
2025 Batch - Campus Drive-Pragmatiq Systems
No ratings yet
2025 Batch - Campus Drive-Pragmatiq Systems
3 pages
Planned Maintenance System For Ship
No ratings yet
Planned Maintenance System For Ship
2 pages
Bitzer HSN 6461-50-40P Specifications
No ratings yet
Bitzer HSN 6461-50-40P Specifications
4 pages
Exp No. 7 - Load Test On Single Phase Transformer
No ratings yet
Exp No. 7 - Load Test On Single Phase Transformer
3 pages
IoT Multiple Choice Questions
No ratings yet
IoT Multiple Choice Questions
4 pages
hAP Lite - User Manuals - MikroTik Documentation
No ratings yet
hAP Lite - User Manuals - MikroTik Documentation
1 page
Stock Scanning for Nifty 50 Traders
No ratings yet
Stock Scanning for Nifty 50 Traders
2 pages
Calculator Techniques by Engr. Mendoza
No ratings yet
Calculator Techniques by Engr. Mendoza
92 pages
CY 2022 DOST GIA Approved Projects From January To July 2022
No ratings yet
CY 2022 DOST GIA Approved Projects From January To July 2022
252 pages
Savings Account Statement 04/2024-07/2024
No ratings yet
Savings Account Statement 04/2024-07/2024
8 pages
12 - Gaurav Khairnar - Professional Experience 01 - 3 Yrs 0 Month
No ratings yet
12 - Gaurav Khairnar - Professional Experience 01 - 3 Yrs 0 Month
3 pages
Ramp Timer Pro Installation Guide
No ratings yet
Ramp Timer Pro Installation Guide
6 pages
RC8B4 Kit Assembly Manual Guide
No ratings yet
RC8B4 Kit Assembly Manual Guide
30 pages
Grade 6 ICT: Digital Citizenship
No ratings yet
Grade 6 ICT: Digital Citizenship
3 pages
Statement Sutton Bank November 2024
No ratings yet
Statement Sutton Bank November 2024
2 pages
PIC WEB Manual
No ratings yet
PIC WEB Manual
36 pages
Datasheet DINFIR3
No ratings yet
Datasheet DINFIR3
6 pages
Sde Price List JCB 3DX3
No ratings yet
Sde Price List JCB 3DX3
1 page
How Trade Syntheticindices Fa
100% (6)
How Trade Syntheticindices Fa
53 pages
Instruction Set of 8085
No ratings yet
Instruction Set of 8085
22 pages
Variance Component Estimation Methods
No ratings yet
Variance Component Estimation Methods
6 pages

2-Tasks and Techniques

Uploaded by

2-Tasks and Techniques

Uploaded by

Data Mining

Tasks and Techniques

Classi cation and Prediction

➡ Mining of Frequent Pattern

• refers to the data to be associated with classes or concepts

• these descriptions can be derived in the following ways

➡ Data Characterization - refers to summarizing data of class under study. Class

• Frequent patterns occur in transactional data

➡ Frequent Subsequence - a sequence of patterns that occur frequently such as

• Associations are used in retail to identify patterns that are frequently

• It is a kind of additional analysis performed to uncover interesting statistical

Classification (If-Then) Rules

➡ This Data Mining technique helps

➡ Describing the data by a few clusters

➡ Clustering analysis is a data mining

➡ Regression, primarily is a form of

➡ it gives exact relationship between two

➡ It nds hidden pattern in the data set

➡ These are if-then statements that support

➡ Association Rule mining has several

➡ This technique may be used in various

➡ Outlier is a data point that diverge too

➡ It is valuable in elds like network

➡ It comprises of nding interesting

➡ This technique helps to discover or

➡ It analyzes past events or instances in

You might also like