0% ont trouvé ce document utile (0 vote)

198 vues18 pages

Data Mining CAH

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

198 vues18 pages

Data Mining CAH

Transféré par

Akrem Zouabi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

Data Mining

Apprentissage non supervisé

Techniques de Data Mining
Apprentissage Non Supervisé Apprentissage supervisé
Analyse descriptive Analyse prédictive

 Fournir directement des résultats : à interpréter  Fournir un modèle (et non pas des résultats),
et à utiliser .
créé à partir d’un entrepôt d’apprentissage,
 Mettre en évidence des connaissances testé et validé sur un entrepôt de test, et utilisé
présentes mais cachées par le volume des dans les problèmes de prise de décision sur des
données.
entrepôts de travail
 Réduire, résumer, synthétiser les masses de
données.  visent à découvrir de nouvelles informations à
 Pas de variable « cible » partir des informations présentes :
connaissances, décisions
 expliquent mieux les données
 Une ou plusieurs variables « cibles»
Apprentissage Non Supervisé
Analyse descriptive
Classification Ascendante Hiérarchique
CAH
Classification Ascendante Hiérarchique
• La classification s’intéresse à des tableaux
de données individus ×variables quantitatives

• Objectifs: production d’une structure (arborescence)

permettant :
 La mise en évidence de liens hiérarchique entre individus
Ou groupes d’individus,
 La détection d’un nombre de classes
« naturel » au sein de la population
CAH - Algorithme
Définir une mesure de distance entre
Entrée : tableau de données (X) individus
Sortie : Indicateur de partition des individus

Calcul du tableau des distances entre individus

Chaque individu constitue un groupe (classe) Définir une stratégie d’agrégation c.-à-d.
REPETER une mesure de dissimilarité entre groupes
Détecter les 2 groupes les plus proches
(entre un individu et un groupe)
Les agréger pour n’en former qu’un seul
JUSQU’À tous les individus forment un seul groupe

Identifier le nombre adéquat de groupes

Procéder au partitionnement De quel outil peut-on disposer pour
identifier la «bonne» partition ?
Dendrogramme.
Critères de ressemblance
Ressemblance entre individus:
 distance euclidienne
 indice de similarités
…

Ressemblance entre groupes d’individus:

 saut minimum ou lien simple (plus petite distance)
 lien complet (plus grande distance)
 Critère de Ward ( à voir)
Algorithme – Calcul des distances

• Déterminer la matrice des distance

• Chercher la plus petite destance
Algorithme – Calcul des distances
Algorithme
Algorithme
Algorithme
Algorithme
Arbres et partitions
• On définit un niveau de coupure sur l’arbre
• On construit une partition.

Remarque: vu le mode de construction

La partition n’est pas optimale mais
intéressante.
Qualité d’une partition
• Une partition est bonne:
Si les individus d’une même classe sont proches
Si les individus de 2 classes différentes sont éloignés

• Mathématiquement:
Variabilité intra-classe petite
Variabilité inter-classe grande
Qualité d’une partition
Qualité d’une partition
Qualité d’une partition
• Méthode de Ward:
Initialisation: 1 classe = 1 individu Inertie inter =1
A chaque étape: agréger les classes a et b qui minimisent la
diminution de l’inertie inter.

Vous aimerez peut-être aussi

Techniques de Datamining en Cours
Pas encore d'évaluation
Techniques de Datamining en Cours
19 pages
Datamining : Exercices et Corrigés Master
Pas encore d'évaluation
Datamining : Exercices et Corrigés Master
6 pages
Introduction à l'apprentissage non supervisé
Pas encore d'évaluation
Introduction à l'apprentissage non supervisé
43 pages
Examen Master 2 ISEFAR : Classification Data-Mining
Pas encore d'évaluation
Examen Master 2 ISEFAR : Classification Data-Mining
3 pages
Introduction aux KNN en Machine Learning
Pas encore d'évaluation
Introduction aux KNN en Machine Learning
8 pages
Ensemble Learning - Forêt Aléatoire, Boosting, Stacking
Pas encore d'évaluation
Ensemble Learning - Forêt Aléatoire, Boosting, Stacking
26 pages
Classification par K-Medoids
Pas encore d'évaluation
Classification par K-Medoids
30 pages
Outil de détection de plagiat en informatique
Pas encore d'évaluation
Outil de détection de plagiat en informatique
72 pages
Introduction au K Nearest Neighbours (KNN)
Pas encore d'évaluation
Introduction au K Nearest Neighbours (KNN)
9 pages
TP 2 Clustering
Pas encore d'évaluation
TP 2 Clustering
2 pages
Corrigé Examen Kmeans et Clustering
Pas encore d'évaluation
Corrigé Examen Kmeans et Clustering
5 pages
Optimisation des Hyperparamètres en ML
Pas encore d'évaluation
Optimisation des Hyperparamètres en ML
39 pages
Algorithme k-NN : Concepts et Applications
Pas encore d'évaluation
Algorithme k-NN : Concepts et Applications
32 pages
Chapitre 6 Clustering Hi-Rarchique
Pas encore d'évaluation
Chapitre 6 Clustering Hi-Rarchique
62 pages
Régression Linéaire: Algorithme et Optimisation
Pas encore d'évaluation
Régression Linéaire: Algorithme et Optimisation
34 pages
Quiz 02-K Nearest Neighbors
100% (1)
Quiz 02-K Nearest Neighbors
1 page
Algorithmes d'IA et Machine Learning
Pas encore d'évaluation
Algorithmes d'IA et Machine Learning
10 pages
Introduction à la régression linéaire
Pas encore d'évaluation
Introduction à la régression linéaire
71 pages
TP Sur Regression Logistique
Pas encore d'évaluation
TP Sur Regression Logistique
4 pages
TD1 Apriori
100% (1)
TD1 Apriori
2 pages
Apprentissage Supervise
Pas encore d'évaluation
Apprentissage Supervise
16 pages
Classification Par Arbre de Décision ID3 C4.5 EXC
Pas encore d'évaluation
Classification Par Arbre de Décision ID3 C4.5 EXC
103 pages
Le KNN
Pas encore d'évaluation
Le KNN
14 pages
Méthodes de Classification en Apprentissage Supervisé
Pas encore d'évaluation
Méthodes de Classification en Apprentissage Supervisé
63 pages
Techniques de Clustering
100% (2)
Techniques de Clustering
50 pages
Bases de Données Distribuées : Concepts clés
100% (1)
Bases de Données Distribuées : Concepts clés
214 pages
Arbres de Décision et Algorithme ID3
Pas encore d'évaluation
Arbres de Décision et Algorithme ID3
17 pages
Arbres - Decision 18 19
Pas encore d'évaluation
Arbres - Decision 18 19
76 pages
Data Mining Chapitre 2 - Méthodes de Prétraitements Et Préparation de Données
50% (2)
Data Mining Chapitre 2 - Méthodes de Prétraitements Et Préparation de Données
10 pages
Cours 4 Clustering
Pas encore d'évaluation
Cours 4 Clustering
40 pages
Chapitre 1 DM
Pas encore d'évaluation
Chapitre 1 DM
73 pages
Exam Modeles Pour Le Datamining 2015 2016cor
Pas encore d'évaluation
Exam Modeles Pour Le Datamining 2015 2016cor
4 pages
Machine Learning : Descente de Gradient et Régressions
Pas encore d'évaluation
Machine Learning : Descente de Gradient et Régressions
3 pages
Optimisation et Modélisation IA
Pas encore d'évaluation
Optimisation et Modélisation IA
82 pages
Chapitre 5 - Les Arbres de D-Cision
Pas encore d'évaluation
Chapitre 5 - Les Arbres de D-Cision
33 pages
TD4-Clustering1 (Corrigé)
100% (1)
TD4-Clustering1 (Corrigé)
3 pages
Chapitre2 DecisionTrees CART
Pas encore d'évaluation
Chapitre2 DecisionTrees CART
53 pages
7 Apprentissage Non Supervisé
Pas encore d'évaluation
7 Apprentissage Non Supervisé
25 pages
Analyse des Règles d'Association en Data Mining
Pas encore d'évaluation
Analyse des Règles d'Association en Data Mining
12 pages
Systèmes de Recommandation Collaboratifs
Pas encore d'évaluation
Systèmes de Recommandation Collaboratifs
79 pages
Clustering et Distances en ML
Pas encore d'évaluation
Clustering et Distances en ML
129 pages
Arbres de Décision : Classification et Segmentation
Pas encore d'évaluation
Arbres de Décision : Classification et Segmentation
43 pages
Prétraitement des données en data mining
Pas encore d'évaluation
Prétraitement des données en data mining
1 page
Output 4
Pas encore d'évaluation
Output 4
3 pages
Arbres de décision en data mining
Pas encore d'évaluation
Arbres de décision en data mining
49 pages
03-Apprentissage Automatique
Pas encore d'évaluation
03-Apprentissage Automatique
63 pages
Introduction à l'algorithme k-NN
Pas encore d'évaluation
Introduction à l'algorithme k-NN
22 pages
KNIME
Pas encore d'évaluation
KNIME
20 pages
Cours DL - Part5 (Prof)
Pas encore d'évaluation
Cours DL - Part5 (Prof)
78 pages
Fondements de la Régression Linéaire
Pas encore d'évaluation
Fondements de la Régression Linéaire
42 pages
Analyse du Data Mining dans le Cinéma
Pas encore d'évaluation
Analyse du Data Mining dans le Cinéma
31 pages
Définition de K-nearest neighbors
Pas encore d'évaluation
Définition de K-nearest neighbors
25 pages
Examen Master IDM : Fouille de Données
100% (1)
Examen Master IDM : Fouille de Données
2 pages
Examen
Pas encore d'évaluation
Examen
4 pages
Arbres de Décision en Machine Learning
Pas encore d'évaluation
Arbres de Décision en Machine Learning
82 pages
Introduction aux SVM et classification
Pas encore d'évaluation
Introduction aux SVM et classification
18 pages
Introduction au Data Mining et ses enjeux
Pas encore d'évaluation
Introduction au Data Mining et ses enjeux
26 pages
Introduction à la Fouille de Données
Pas encore d'évaluation
Introduction à la Fouille de Données
254 pages
Clustering en apprentissage non supervisé
Pas encore d'évaluation
Clustering en apprentissage non supervisé
56 pages
Les Techniques de Data Mining (Version Etudiant)
Pas encore d'évaluation
Les Techniques de Data Mining (Version Etudiant)
32 pages
Le Marketing Digital de A C3a0 Z PDF
Pas encore d'évaluation
Le Marketing Digital de A C3a0 Z PDF
42 pages
Offre Administrative Video 2d
Pas encore d'évaluation
Offre Administrative Video 2d
1 page
Offre Video 2d
Pas encore d'évaluation
Offre Video 2d
2 pages
Stratégie Nationale Biotech Santé Tunisie
Pas encore d'évaluation
Stratégie Nationale Biotech Santé Tunisie
26 pages
Social Media Editorial Calendar July 2021 - Pharma Shop
Pas encore d'évaluation
Social Media Editorial Calendar July 2021 - Pharma Shop
1 page
Etude Ethnobotanique Dans Le Sud-Est de Chlef (Algerie Occidentale)
Pas encore d'évaluation
Etude Ethnobotanique Dans Le Sud-Est de Chlef (Algerie Occidentale)
18 pages
Paiement Mobile pour Jeunes Tunisiens
Pas encore d'évaluation
Paiement Mobile pour Jeunes Tunisiens
65 pages
Etude de Cas Gias
Pas encore d'évaluation
Etude de Cas Gias
3 pages
Stratégies Export et Influence "Made in France" d'Arcancil
Pas encore d'évaluation
Stratégies Export et Influence "Made in France" d'Arcancil
1 page
Cir 2020 11 FR
Pas encore d'évaluation
Cir 2020 11 FR
18 pages
Etat Des Lieux Des Paiements Électroniques en Tunisie Par MR Bettaieb 1 PDF
Pas encore d'évaluation
Etat Des Lieux Des Paiements Électroniques en Tunisie Par MR Bettaieb 1 PDF
23 pages
Questions Pervasive IOT Correction
Pas encore d'évaluation
Questions Pervasive IOT Correction
6 pages
Sécurité et confidentialité de l'IoT
Pas encore d'évaluation
Sécurité et confidentialité de l'IoT
8 pages
Problèmes de flux Facebook sur Netvibes
100% (2)
Problèmes de flux Facebook sur Netvibes
20 pages
Analyse de régression multiple et résultats
Pas encore d'évaluation
Analyse de régression multiple et résultats
28 pages
Le Concept Tiré Des Nuées D'oiseaux: L'optimisation Par Essaims de Particules
Pas encore d'évaluation
Le Concept Tiré Des Nuées D'oiseaux: L'optimisation Par Essaims de Particules
15 pages
Digitalisation et Transformation Numérique
100% (7)
Digitalisation et Transformation Numérique
19 pages
Processus Markov
Pas encore d'évaluation
Processus Markov
6 pages
Fog Computing
Pas encore d'évaluation
Fog Computing
13 pages
Travail Non Présentiel
Pas encore d'évaluation
Travail Non Présentiel
1 page
L'optimisation Par Essaims de Particules
100% (2)
L'optimisation Par Essaims de Particules
18 pages
Examen Irs
Pas encore d'évaluation
Examen Irs
5 pages
Rapport Final de Stage Aéroport Fes
Pas encore d'évaluation
Rapport Final de Stage Aéroport Fes
75 pages
Coordonnées Curvilignes
Pas encore d'évaluation
Coordonnées Curvilignes
13 pages
GDScript Essentiels Godot
Pas encore d'évaluation
GDScript Essentiels Godot
6 pages
Circuits Électriques : Concepts et Lois
Pas encore d'évaluation
Circuits Électriques : Concepts et Lois
66 pages
Acupuncture et bronchite chronique : étude révélatrice
Pas encore d'évaluation
Acupuncture et bronchite chronique : étude révélatrice
2 pages
Formation en Électricité Industrielle
Pas encore d'évaluation
Formation en Électricité Industrielle
4 pages
Contrôle d'Accès en Sécurité Établissement
Pas encore d'évaluation
Contrôle d'Accès en Sécurité Établissement
5 pages
Attachment
100% (5)
Attachment
22 pages
DS1 1
Pas encore d'évaluation
DS1 1
14 pages
Cours 2 - Introduction À TypeScript
Pas encore d'évaluation
Cours 2 - Introduction À TypeScript
38 pages
Rôle de L'infirmier en Hémodialyse Chronique
Pas encore d'évaluation
Rôle de L'infirmier en Hémodialyse Chronique
19 pages
Reevaluation Des Actifs Immobilises Et L-Opinion D-Audit - Maher Gaida
Pas encore d'évaluation
Reevaluation Des Actifs Immobilises Et L-Opinion D-Audit - Maher Gaida
56 pages
Fy23 Gronlid hfb01 r1 008-Web
Pas encore d'évaluation
Fy23 Gronlid hfb01 r1 008-Web
5 pages
Feuille D'installation Des Annonceurs ACM
Pas encore d'évaluation
Feuille D'installation Des Annonceurs ACM
4 pages
Éruption Montagne Pelée : Étude de mouvement
Pas encore d'évaluation
Éruption Montagne Pelée : Étude de mouvement
3 pages
TD Droit Fiscal DCG Serie 1 2024
Pas encore d'évaluation
TD Droit Fiscal DCG Serie 1 2024
6 pages
ET2503220044 exportKaliRes P 202503241915341
Pas encore d'évaluation
ET2503220044 exportKaliRes P 202503241915341
4 pages
Épreuve de Génétique - QCM 2016
Pas encore d'évaluation
Épreuve de Génétique - QCM 2016
14 pages
Exemples de Rédactions Pour Bourses D'études Basées Sur Les Besoins Financiers
Pas encore d'évaluation
Exemples de Rédactions Pour Bourses D'études Basées Sur Les Besoins Financiers
6 pages
Définition et Classification des Lipides
Pas encore d'évaluation
Définition et Classification des Lipides
25 pages
Traduction Anglais-Français en ligne
Pas encore d'évaluation
Traduction Anglais-Français en ligne
20 pages
Exercice Bouteille 3
Pas encore d'évaluation
Exercice Bouteille 3
4 pages
Guide de Configuration CME Cisco
100% (1)
Guide de Configuration CME Cisco
86 pages
Projet de Classe Séance 1 Créer Une Affiche Sur Les Règles de Vie À L'école (4 Files Merged)
Pas encore d'évaluation
Projet de Classe Séance 1 Créer Une Affiche Sur Les Règles de Vie À L'école (4 Files Merged)
3 pages
DR Raphaëlle Taccone, Le Livre de Cratès Un Traité Alchimique Arabe Du Moyen Age
Pas encore d'évaluation
DR Raphaëlle Taccone, Le Livre de Cratès Un Traité Alchimique Arabe Du Moyen Age
19 pages
Cours de Programmation en Langage C
Pas encore d'évaluation
Cours de Programmation en Langage C
103 pages
All About Faith
Pas encore d'évaluation
All About Faith
4 pages
ICT FR Focus Et EDP Par Richselect
Pas encore d'évaluation
ICT FR Focus Et EDP Par Richselect
13 pages
Plan d'étage détaillé d'une maison
Pas encore d'évaluation
Plan d'étage détaillé d'une maison
1 page