0% ont trouvé ce document utile (0 vote)

157 vues102 pages

Introduction à la fouille de données

Le document introduit le sujet de la fouille de données. Il présente les motivations de la fouille de données, notamment le problème de l'explosion des données et le besoin d'extraire des informations cachées. Le document décrit également l'évolution historique des bases de données.

Transféré par

Šməì Ĺĕ

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

157 vues102 pages

Introduction à la fouille de données

Transféré par

Šməì Ĺĕ

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction

Fouille de données

Introduction à la fouille de données

M. Ledmi
m_ledmi@[Link]
Département d’Informatique Khenchela

2020/2021

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Plan

1 Introduction

2 Fouille de données
Tâches de fouille de données

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Vous êtes ici

1 Introduction

2 Fouille de données

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

Problème de l’explosion de données !

Les outils automatiques de collecte de données font que les bases

de données contiennent énormément de données.
Plusieurs sources de données :
Entrepôts du Web : ex. Google, youtube.
Réseaux sociaux et hébergement de documents : ex. Facebook, gmail.
e-commerce : Achats dans les supermarchés, transactions de cartes bancaires

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

Problème de l’explosion de données !

Les outils automatiques de collecte de données font que les bases

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

Problème de l’explosion de données !

Les outils automatiques de collecte de données font que les bases

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

Problème de l’explosion de données !

Les outils automatiques de collecte de données font que les bases

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

Problème de l’explosion de données !

Les outils automatiques de collecte de données font que les bases

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

Problème de l’explosion de données !

Les outils automatiques de collecte de données font que les bases

Beaucoup de données mais peu de connaissances !

Difficulté d’accès à l’information.
Trop de pistes à explorer.
M. Ledmi Introduction à la fouille de données
Introduction
Fouille de données

Motivation : Le besoin crée l’invention

Solution !
Par analogie à la recherche des pépites d’or dans un gisement, la fouille
de données vise à :
Extraire des informations cachées par analyse globale ;
Découvrir des modèles (“patterns”) difficiles à percevoir car :
Le volume de données est très grand
Le nombre de variables à considérer est important
Ces “patterns” sont imprévisibles (même à titre d’hypothèse à vérifier).

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Motivation : Le besoin crée l’invention

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Evolution des Bases de Données

1
JAN Historique
1960s : Collecte des données, création des BD’s.
1970s : Modèle et SGBD’s relationnels, SQL, transactions.
1980s : Modèles de données et SGBD’s avancés (relationnel
étendu, OO, déductifs, etc.) et SGBD’s dédiés (spatial, génomique,
engineering, etc.)
1990s : Data mining et data warehousing, BD’s multimédia, BD’s
sur le WEB

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Evolution des Bases de Données

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Evolution des Bases de Données

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Evolution des Bases de Données

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Donnée

Donnée
Une donnée est le résultat direct d’une mesure.
Elle peut être collectée par un outil de supervision, par une
personne ou être déjà présente dans une base de données par ex.
Une donnée seule ne permet pas de prendre une décision sur une
action à lancer.

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Donnée

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Donnée

Exemple :
Il fait 15° dans cette pièce.

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Information

Information
Une information est une donnée à laquelle un sens et une interprétation
ont été donnés.
Une information permet à un responsable opérationnel de prendre
une décision (d’échelle locale ou à petite échelle) sur une action à
mener.

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Information

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Information

Exemple :
les données précédentes sont interprétées de la manière suivante :
Il fait froid dans cette pièce.

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Connaissance

Connaissance
La connaissance est le résultat d’une réflexion sur les informations ana-
lysées en se basant sur :
ses expériences, ses idées, ses valeurs.
les avis d’autres personnes consultées pour l’occasion

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Connaissance

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Concept-clé : Connaissance

Exemple :
Pour avoir chaud, il suffit de monter le chauffage.

M. Ledmi Introduction à la fouille de données

Introduction
Fouille de données

Quelques références bibliographiques

Data Mining : Concepts and techniques,

Auteur :Jiawei Han & Micheline Kamber,
Edition : Morgan Kaufmann, 2000.
Fouille de données, Notes de cours,
Auteur : Ph. PREUX, Université de Lille 3
Lien : http:\[Link]/~ppreux/fouille

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Vous êtes ici

1 Introduction

2 Fouille de données
Tâches de fouille de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

La révolution numérique a rendu l’information facile à être

capturer, traiter, stocker,
distribuer et transmettre.
Progrès et utilisation des technologies informatiques dans les différents
domaines de la vie,
Grandes quantités de données diverses continueront d’être collectées et
stockées dans les bases de données.
Si la quantité d’informations double tous les mois, la taille et le
nombre de bases de données augmente probablement à un rythme
similaire.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

La révolution numérique a rendu l’information facile à être

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

La révolution numérique a rendu l’information facile à être

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

La révolution numérique a rendu l’information facile à être

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

La révolution numérique a rendu l’information facile à être

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

L’extraction des connaissances à partir de ce grand volume est un défi :

Plus on a de données,
Plus il est difficile d’en tirer de la connaissance.
La fouille de données est une tentative
Explorer et d’analyser cet énorme volume de données afin d’y
découvrir de l’information implicite.
Règles d’association, une classification ou une segmentation de
population.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

L’extraction des connaissances à partir de ce grand volume est un défi :

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

L’extraction des connaissances à partir de ce grand volume est un défi :

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

L’extraction des connaissances à partir de ce grand volume est un défi :

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Introduction

L’extraction des connaissances à partir de ce grand volume est un défi :

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Fouille de données
Data mining
L’extraction des connaissances à partir des données est un processus
non trivial d’identification des modèles valides, nouveaux, potentielle-
ment utiles et au final compréhensibles, à partir de données.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Valide : vérifiée par des experts du domaine et correcte dans le

futur.
Nouveau : Ce qui est recherché est non prévisible, inconnu.
Utile : utilisé pour prendre des décisions.
Compréhensible : significatif et facile à comprendre.
M. Ledmi Introduction à la fouille de données
Introduction
Tâches de fouille de données
Fouille de données

Valide : vérifiée par des experts du domaine et correcte dans le

Schéma de l’ECD

1. La compréhension du domaine Evaluation

Interprétation
d’application : Connaîssances

Fouille
Connaissance a priori, de l’application. de données
Modèles
Connaissance des objectifs à atteindre.
Transformation
Sélection

Collecte Entrepôts
Nettoyage de données
Integration

Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

1. La compréhension du domaine Evaluation

Interprétation
d’application : Connaîssances

Fouille
Connaissance a priori, de l’application. de données
Modèles
Connaissance des objectifs à atteindre.
Transformation
Sélection

Collecte Entrepôts
Nettoyage de données
Integration

Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

1. La compréhension du domaine Evaluation

Interprétation
d’application : Connaîssances

Fouille
Connaissance a priori, de l’application. de données
Modèles
Connaissance des objectifs à atteindre.
Transformation
2. Extractions des données cibles : Sélection

Collecte Entrepôts
Sélection d’un ensemble de données. Nettoyage de données
Integration
Concentrer sur un sous-ensemble de
variables.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

1. La compréhension du domaine Evaluation

Interprétation
d’application : Connaîssances

Fouille
Connaissance a priori, de l’application. de données
Modèles
Connaissance des objectifs à atteindre.
Transformation
2. Extractions des données cibles : Sélection

Collecte Entrepôts
Sélection d’un ensemble de données. Nettoyage de données
Integration
Concentrer sur un sous-ensemble de
variables.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

3. Prétraitements des données : Evaluation

Interprétation

améliore la qualité des données. Connaîssances

Fouille
augmente l’efficacité de l’extraction. de données
Modèles

Nettoyage : normalisation, suppression Transformation

du bruit , manipulation des données Sélection

manquantes. Collecte Entrepôts

Nettoyage de données
Integration
Intégration : multiples ensembles de
données hétérogènes.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

3. Prétraitements des données : Evaluation

Interprétation

améliore la qualité des données. Connaîssances

Fouille
augmente l’efficacité de l’extraction. de données
Modèles

Nettoyage : normalisation, suppression Transformation

du bruit , manipulation des données Sélection

manquantes. Collecte Entrepôts

Nettoyage de données
Integration
Intégration : multiples ensembles de
données hétérogènes.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

3. Prétraitements des données : Evaluation

Interprétation

améliore la qualité des données. Connaîssances

Fouille
augmente l’efficacité de l’extraction. de données
Modèles

Nettoyage : normalisation, suppression Transformation

du bruit , manipulation des données Sélection

manquantes. Collecte Entrepôts

Nettoyage de données
Integration
Intégration : multiples ensembles de
données hétérogènes.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

3. Prétraitements des données : Evaluation

Interprétation

améliore la qualité des données. Connaîssances

Fouille
augmente l’efficacité de l’extraction. de données
Modèles

Nettoyage : normalisation, suppression Transformation

du bruit , manipulation des données Sélection

manquantes. Collecte Entrepôts

Nettoyage de données
Integration
Intégration : multiples ensembles de
données hétérogènes.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
Interprétation
Connaîssances
4. Fouille de données : correspond à l’une Fouille
de données
ou plusieurs des tâches : Modèles

Classification, Transformation
Sélection
Clustering,
Collecte Entrepôts
Règles d’association , . . . etc. Nettoyage de données
Integration

Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
Interprétation
Connaîssances
4. Fouille de données : correspond à l’une Fouille
de données
ou plusieurs des tâches : Modèles

Classification, Transformation
Sélection
Clustering,
Collecte Entrepôts
Règles d’association , . . . etc. Nettoyage de données
Integration

Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
Interprétation
Connaîssances
4. Fouille de données : correspond à l’une Fouille
de données
ou plusieurs des tâches : Modèles

Classification, Transformation
Sélection
Clustering,
Collecte Entrepôts
Règles d’association , . . . etc. Nettoyage de données
Integration

Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
5. Interprétation : Interprétation
Connaîssances

Interprétation des modèles découverts, Fouille

de données
Modèles
Visualisation possible des modèles
extraits. Transformation
Sélection

Evaluer les modèles extraits pour Collecte Entrepôts

Nettoyage de données
identifier les modèles utiles pour Integration

l’utilisateur.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
5. Interprétation : Interprétation
Connaîssances

Interprétation des modèles découverts, Fouille

de données
Modèles
Visualisation possible des modèles
extraits. Transformation
Sélection

Evaluer les modèles extraits pour Collecte Entrepôts

Nettoyage de données
identifier les modèles utiles pour Integration

l’utilisateur.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
5. Interprétation : Interprétation
Connaîssances

Interprétation des modèles découverts, Fouille

de données
Modèles
Visualisation possible des modèles
extraits. Transformation
Sélection

Evaluer les modèles extraits pour Collecte Entrepôts

Nettoyage de données
identifier les modèles utiles pour Integration

l’utilisateur.
Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
Interprétation
Connaîssances
6. Utilisation des connaissances Fouille
de données
découvertes : Modèles

Intégration de ces connaissances dans Transformation

Sélection
des systèmes performants,
Collecte Entrepôts
Mettre à la disposition des décideurs. Nettoyage de données
Integration

Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Schéma de l’ECD

Evaluation
Interprétation
Connaîssances
6. Utilisation des connaissances Fouille
de données
découvertes : Modèles

Intégration de ces connaissances dans Transformation

Sélection
des systèmes performants,
Collecte Entrepôts
Mettre à la disposition des décideurs. Nettoyage de données
Integration

Sources de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Tâches de fouille de données

Classées en deux catégories

Tâches descriptives
caractérisent les propriétés des données contenues dans un ensemble de
données de cibles.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Tâches de fouille de données

Classées en deux catégories

Tâches descriptives
caractérisent les propriétés des données contenues dans un ensemble de
données de cibles.

Tâches prédictives
effectuent une induction sur les données actuelles afin de faire des pré-
dictions.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Classification

Classification :
La classification (appelée aussi apprentissage supervisé) est le processus
de recherche d’un modèle (ou une fonction) qui décrit et distingue des
classes de données ou des concepts.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Classification

Le modèle est établi en se basant sur l’analyse d’un ensemble de

données d’apprentissage.
il est utilisé pour prédire la classe d’objets dont la classe est
inconnue.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Classification

Le modèle est établi en se basant sur l’analyse d’un ensemble de

données d’apprentissage.
il est utilisé pour prédire la classe d’objets dont la classe est
inconnue.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Arbre de décision
Un arbre de décision est un organigramme ayant une structure
arborescente où :
Chaque noeud représente un test sur une valeur d’attribut,
Chaque branche représente un résultat de test, et
Les feuilles représentent des classes.

Age ?
Jeune Senior
Revenu ? Classe C
Elevé Bas
Classe A Classe B

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Age ?
Jeune Senior
Revenu ? Classe C
Elevé Bas
Classe A Classe B

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Age ?
Jeune Senior
Revenu ? Classe C
Elevé Bas
Classe A Classe B

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Réseau de neurones

Un réseau de neurones est généralement une collection de neurones :

des unités de traitement,
des connexions pondérées entre les unités.

f3 f7 Classe A
Age f1
f4 f8 Classe B
Revenu f2
f5 f9 Classe C

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Réseau de neurones

Un réseau de neurones est généralement une collection de neurones :

des unités de traitement,
des connexions pondérées entre les unités.

f3 f7 Classe A
Age f1
f4 f8 Classe B
Revenu f2
f5 f9 Classe C

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Autres classifieurs

Les modèles probabilistes qui calculent les probabilités pour des

hypothèses basées sur le théorème de Bayes.
Les classifieurs plus proches voisins, qui calculent la distance minimale
à partir d’instances ou de prototypes.
Les règles de classification

Age(X,’Jeune’) ET Revenu(X,’Elevé’) → Classe(X,’A’)

Age(X,’Jeune’) ET Revenu(X,’Bas’) → Classe(X,’B’)
Age(X,’Senior’) → Classe(X,’C ’)

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Autres classifieurs

Les modèles probabilistes qui calculent les probabilités pour des

hypothèses basées sur le théorème de Bayes.
Les classifieurs plus proches voisins, qui calculent la distance minimale
à partir d’instances ou de prototypes.
Les règles de classification

Age(X,’Jeune’) ET Revenu(X,’Elevé’) → Classe(X,’A’)

Age(X,’Jeune’) ET Revenu(X,’Bas’) → Classe(X,’B’)
Age(X,’Senior’) → Classe(X,’C ’)

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Autres classifieurs

Les modèles probabilistes qui calculent les probabilités pour des

hypothèses basées sur le théorème de Bayes.
Les classifieurs plus proches voisins, qui calculent la distance minimale
à partir d’instances ou de prototypes.
Les règles de classification

Age(X,’Jeune’) ET Revenu(X,’Elevé’) → Classe(X,’A’)

Age(X,’Jeune’) ET Revenu(X,’Bas’) → Classe(X,’B’)
Age(X,’Senior’) → Classe(X,’C ’)

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la classification

Identification de signature des documents sensibles (correspondance,

aucune correspondance).
Identification d’empreinte digitale numérique dans des applications de
sécurité (correspondance, aucune correspondance).
Attribuer un crédit bancaire considérant de la qualité de la clientèle,
et les possibilités financières (bon, moyen, mauvais).
L’efficacité du traitement d’un médicament en présence d’un ensemble
de maladies symptômes (bon, moyen, mauvais).

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la classification

Identification de signature des documents sensibles (correspondance,

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la classification

Identification de signature des documents sensibles (correspondance,

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la classification

Identification de signature des documents sensibles (correspondance,

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Segmentation( Clustering)

La segmentation se rapporte à la
catégorisation d’un ensemble d’objets de
données dans des clusters.
Elle est aussi appelée classification non
supervisée.
Un cluster est une collection d’objets de
données :
Similaires les uns aux autres dans le même
segment,
Différents des objets dans d’autres segments.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Segmentation( Clustering)

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Segmentation( Clustering)

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Segmentation( Clustering)

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

Méthode de partitionnement :
Créer un partitionnement initial.
Utiliser une stratégie de contrôle itérative
pour l’optimiser.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

Méthodes hiérarchiques :
Construire une hiérarchie de clusters (appelé
dendrogramme),
Non seulement un partitionnement unique
des objets.
Utiliser une condition de terminaison. (ex.
Nombre de clusters).
Méthodes basées sur la densité : utiliser les
fonctions de densité de voisinage.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Approches de clustering

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

Analyse des données spatiales : créer des cartes thématiques dans les
systèmes d’information géographique (SIG).
Bioinformatique : la détermination des groupes de signatures à partir
d’une base de données de gènes.
Web : clustering des fichiers log pour découvrir des modèles d’accès
similaires.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Exemples d’application de la segmentation

La reconnaissance de formes et le traitement d’images.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Règles d’association
La fouille de règles d’association se rapporte à la découverte des relations
entre les attributs d’un ensemble de données appelé souvent ensemble des
transactions.
Une transaction est l’ensemble des articles achetés ensemble par les
clients.
Une règle est normalement exprimée sous la forme A ⇒ B, où A et B
sont des ensembles d’attributs de l’ensemble de données. Cela
implique que les transactions qui contiennent A contiennent B avec
une grande probabilité.
La règle peut s’écrire sous une autre forme :
SI <certaines conditions satisfaites > ALORS <prédire les valeurs
pour certains autres attributs>,

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Règles d’association

Une règle d’association A ⇒ B peut être identifié lorsque le support et la

confiance de la règle sont largement supérieurs aux seuils respectifs.
Le support de la règle d’association est le rapport entre le nombre de
transactions contenant à la fois A et B sur le nombre total de
transactions dans la base de données.
La confiance de la règle d’association est la proportion du nombre de
transactions contenant à la fois A et B sur le nombre total de
transactions contenant A.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Règles d’association

Une règle d’association A ⇒ B peut être identifié lorsque le support et la

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Règles d’association

Par exemple, la règle :

Age(X, 20..29)∧ revenu(X, 40000..49000) ⇒ achète(X , “Ordinatur portable”)
( support 2%, confiance 60%)
signifie que :
2% des clients sont âgés de 20 à 29 ans ayant un revenu compris entre
40.000 et 49.000 et ont achetés un ordinateur portable.
Il y a une probabilité de 60% qu’un client dans cet intervalle d’âge et
de revenu va acheter un ordinateur portable.

M. Ledmi Introduction à la fouille de données

Introduction
Tâches de fouille de données
Fouille de données

Règles d’association

Par exemple, la règle :

M. Ledmi Introduction à la fouille de données

Vous aimerez peut-être aussi

Chapitre 1 DM
Pas encore d'évaluation
Chapitre 1 DM
73 pages
INF3712 Datamining
Pas encore d'évaluation
INF3712 Datamining
7 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
6 pages
01 Introduction DM
Pas encore d'évaluation
01 Introduction DM
26 pages
Cours - Polycopié Data Mining - Brahim FAROU (Université de Guelma, 2022)
Pas encore d'évaluation
Cours - Polycopié Data Mining - Brahim FAROU (Université de Guelma, 2022)
188 pages
Chap.01 Intro 18-19 1
Pas encore d'évaluation
Chap.01 Intro 18-19 1
17 pages
Chap - Analyse D'associations - Partie 01-18-19
Pas encore d'évaluation
Chap - Analyse D'associations - Partie 01-18-19
12 pages
Chap.01 Intro 18-19 2
Pas encore d'évaluation
Chap.01 Intro 18-19 2
9 pages
Introduction à la Data Science
Pas encore d'évaluation
Introduction à la Data Science
23 pages
KNN - Découvrez Cet Algorithme de Machine Learning PDF
Pas encore d'évaluation
KNN - Découvrez Cet Algorithme de Machine Learning PDF
5 pages
Ch1-Extraction Des Connaissances À Partir Des Données
Pas encore d'évaluation
Ch1-Extraction Des Connaissances À Partir Des Données
53 pages
Chapitre 2 - Motifs Fréquents Et Règles D'associations
Pas encore d'évaluation
Chapitre 2 - Motifs Fréquents Et Règles D'associations
42 pages
Intro Data Mining v2
Pas encore d'évaluation
Intro Data Mining v2
69 pages
Chapitre 1 EMSI
Pas encore d'évaluation
Chapitre 1 EMSI
26 pages
Chap 1
Pas encore d'évaluation
Chap 1
25 pages
E4dhq-Chap 4 Clustering
Pas encore d'évaluation
E4dhq-Chap 4 Clustering
86 pages
Cours sur l'Analyse des Données
Pas encore d'évaluation
Cours sur l'Analyse des Données
46 pages
Chapitre1 DM Rebbah
Pas encore d'évaluation
Chapitre1 DM Rebbah
19 pages
TD1 Apriori
100% (1)
TD1 Apriori
2 pages
1 IRAD - FD - Chap1
Pas encore d'évaluation
1 IRAD - FD - Chap1
19 pages
Chap 4
Pas encore d'évaluation
Chap 4
46 pages
Introduction au Text Mining
Pas encore d'évaluation
Introduction au Text Mining
5 pages
Préparation Des Données-Chapitre2
Pas encore d'évaluation
Préparation Des Données-Chapitre2
27 pages
Chapitre6 Intelligence Artificielle
Pas encore d'évaluation
Chapitre6 Intelligence Artificielle
32 pages
CV Ingénieur Data Tahiri El Mamoune
Pas encore d'évaluation
CV Ingénieur Data Tahiri El Mamoune
2 pages
Analyse de Données IA avec Python
Pas encore d'évaluation
Analyse de Données IA avec Python
22 pages
Évaluation des Modèles en Data Mining
Pas encore d'évaluation
Évaluation des Modèles en Data Mining
4 pages
Système de recommandation de films
100% (1)
Système de recommandation de films
4 pages
Cours BDRENSI
100% (1)
Cours BDRENSI
214 pages
Cours de Data Mining
Pas encore d'évaluation
Cours de Data Mining
17 pages
Introduction aux réseaux de neurones
Pas encore d'évaluation
Introduction aux réseaux de neurones
16 pages
Manipulation de Modèles
Pas encore d'évaluation
Manipulation de Modèles
18 pages
Exploration des Données: Guide Essentiel
Pas encore d'évaluation
Exploration des Données: Guide Essentiel
46 pages
DataMining 1 2
Pas encore d'évaluation
DataMining 1 2
80 pages
Chapitre 4 SQL
Pas encore d'évaluation
Chapitre 4 SQL
68 pages
Modèle Logique de Données MLD en MERISE
Pas encore d'évaluation
Modèle Logique de Données MLD en MERISE
18 pages
Machine Learning Cours V1 (MYassineLandolsi)
Pas encore d'évaluation
Machine Learning Cours V1 (MYassineLandolsi)
87 pages
Data Mining
Pas encore d'évaluation
Data Mining
55 pages
Cours Dataviz
Pas encore d'évaluation
Cours Dataviz
76 pages
L Analyse Predectif
Pas encore d'évaluation
L Analyse Predectif
5 pages
Exemple K Means Et HCA PDF
Pas encore d'évaluation
Exemple K Means Et HCA PDF
4 pages
Output 4
Pas encore d'évaluation
Output 4
3 pages
TD 1
Pas encore d'évaluation
TD 1
1 page
Cours Bases de Données ENSAM-MEknès AHMADI 2020 2021
Pas encore d'évaluation
Cours Bases de Données ENSAM-MEknès AHMADI 2020 2021
38 pages
Arbres de décision en science des données
Pas encore d'évaluation
Arbres de décision en science des données
40 pages
DataMining Part2 ECD
100% (1)
DataMining Part2 ECD
38 pages
Cours Archi 2eme Ing Partie 01
Pas encore d'évaluation
Cours Archi 2eme Ing Partie 01
87 pages
DataMining Part3 Classification PDF
Pas encore d'évaluation
DataMining Part3 Classification PDF
64 pages
TP 2 Clustering
Pas encore d'évaluation
TP 2 Clustering
2 pages
Méthode MERISE : Cycle et Modélisation
Pas encore d'évaluation
Méthode MERISE : Cycle et Modélisation
3 pages
Cours Data Mining: Objectifs et Méthodes
Pas encore d'évaluation
Cours Data Mining: Objectifs et Méthodes
106 pages
Partie 3-Data Mining - DRC - 2021-2022
Pas encore d'évaluation
Partie 3-Data Mining - DRC - 2021-2022
47 pages
Cours-Dm Licence 3 - Fevrier 2022 Partie 03
Pas encore d'évaluation
Cours-Dm Licence 3 - Fevrier 2022 Partie 03
30 pages
Sondages électoraux au Maroc : Base de données
Pas encore d'évaluation
Sondages électoraux au Maroc : Base de données
2 pages
Extraction Des Connaissances À Partir Des Données (ECD)
Pas encore d'évaluation
Extraction Des Connaissances À Partir Des Données (ECD)
59 pages
6-Vision Par Ordinateur
Pas encore d'évaluation
6-Vision Par Ordinateur
32 pages
Pre Traitement Donnees 24 Handout
Pas encore d'évaluation
Pre Traitement Donnees 24 Handout
103 pages
Introduction au Clustering et K-Means
Pas encore d'évaluation
Introduction au Clustering et K-Means
61 pages
Cours1 - Intoduction À L'apprentissage Et Complexité
Pas encore d'évaluation
Cours1 - Intoduction À L'apprentissage Et Complexité
42 pages
Cours
Pas encore d'évaluation
Cours
58 pages
Arbres de Décision: Calculs d'Entropie et Gain d'Information
Pas encore d'évaluation
Arbres de Décision: Calculs d'Entropie et Gain d'Information
1 page
R Et La Fouille de Données: M. Ledmi M - Ledmi@esi - DZ
Pas encore d'évaluation
R Et La Fouille de Données: M. Ledmi M - Ledmi@esi - DZ
76 pages
Formation Big Data à Strasbourg
Pas encore d'évaluation
Formation Big Data à Strasbourg
3 pages
Introduction à la Classification
Pas encore d'évaluation
Introduction à la Classification
153 pages
Diagramme de composants pour lecteur audio
Pas encore d'évaluation
Diagramme de composants pour lecteur audio
1 page
Diagramme de Composants d'Agenda
Pas encore d'évaluation
Diagramme de Composants d'Agenda
1 page
Epreuves Énam
Pas encore d'évaluation
Epreuves Énam
2 pages
Étude de Document 5ème Évaluation Notée
Pas encore d'évaluation
Étude de Document 5ème Évaluation Notée
2 pages
S2 CPT100C
Pas encore d'évaluation
S2 CPT100C
4 pages
Rapport de Stage à la Banque Populaire
67% (3)
Rapport de Stage à la Banque Populaire
14 pages
Real Madrid : Match amical à Alger
Pas encore d'évaluation
Real Madrid : Match amical à Alger
25 pages
Dieu Tout Puissant - Arr. Héritage - Carl Boberg
100% (1)
Dieu Tout Puissant - Arr. Héritage - Carl Boberg
2 pages
Diagnostic Infirmier et Qualité des Soins
Pas encore d'évaluation
Diagnostic Infirmier et Qualité des Soins
6 pages
Reglementation Importation Algerie
Pas encore d'évaluation
Reglementation Importation Algerie
3 pages
Croyances et obstacles à la science
Pas encore d'évaluation
Croyances et obstacles à la science
5 pages
Invoquer l'Esprit de l'Eau : Rituel
Pas encore d'évaluation
Invoquer l'Esprit de l'Eau : Rituel
3 pages
La Peau de Chagrin, Balzac - Fiche Et Résumé Pour Le Bac
Pas encore d'évaluation
La Peau de Chagrin, Balzac - Fiche Et Résumé Pour Le Bac
16 pages
Libérez Votre Puissance
Pas encore d'évaluation
Libérez Votre Puissance
739 pages
Lutte Contre La Lèpre
Pas encore d'évaluation
Lutte Contre La Lèpre
3 pages
Maintenir Le Feu Spirituel 1
Pas encore d'évaluation
Maintenir Le Feu Spirituel 1
6 pages
CHAPITRE V Enjeux Des Valeurs, Morale
Pas encore d'évaluation
CHAPITRE V Enjeux Des Valeurs, Morale
3 pages
Antigone
Pas encore d'évaluation
Antigone
6 pages
Rapport de stage et appréciations C.A.P.
Pas encore d'évaluation
Rapport de stage et appréciations C.A.P.
3 pages
Comprendre les organisations internationales
Pas encore d'évaluation
Comprendre les organisations internationales
9 pages
Les Fondements du Secret Professionnel
Pas encore d'évaluation
Les Fondements du Secret Professionnel
21 pages
StarWars - Cello
Pas encore d'évaluation
StarWars - Cello
1 page
Dossier Gorge Mastromas
Pas encore d'évaluation
Dossier Gorge Mastromas
24 pages
TD Ordonnancement
Pas encore d'évaluation
TD Ordonnancement
6 pages
Cours de Comptabilite Des Societes l2 Uipa
Pas encore d'évaluation
Cours de Comptabilite Des Societes l2 Uipa
20 pages
Définition Approfondie Des SIH
Pas encore d'évaluation
Définition Approfondie Des SIH
5 pages
TP - 01-Réalisation Et Tests de Cables - RJ45
Pas encore d'évaluation
TP - 01-Réalisation Et Tests de Cables - RJ45
2 pages
ENCH PDF-NoGRP
Pas encore d'évaluation
ENCH PDF-NoGRP
28 pages
1-Reglage Des Protections Du Depart Centrale
100% (4)
1-Reglage Des Protections Du Depart Centrale
31 pages
Fiche Technique TBS Casablanca 2023
Pas encore d'évaluation
Fiche Technique TBS Casablanca 2023
3 pages
Suivi de la procédure d'accréditation
Pas encore d'évaluation
Suivi de la procédure d'accréditation
12 pages
Module 1 - LCBFT
Pas encore d'évaluation
Module 1 - LCBFT
82 pages