0% ont trouvé ce document utile (0 vote)

13 vues24 pages

06 - Introduction Au DM

Le document présente une introduction au data mining, soulignant l'importance de l'analyse des données pour établir des relations entre variables. Il décrit les méthodes bivariables et multivariables, ainsi que les questions clés que ces méthodes cherchent à résoudre. Enfin, il aborde le processus d'un projet de data mining, incluant la collecte de données, l'analyse statistique et les types d'apprentissage.

Transféré par

AdilHoubbane

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

13 vues24 pages

06 - Introduction Au DM

Transféré par

AdilHoubbane

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Introduction au Data Mining

Pr. Nabila HAMDOUN

Objectif du Traitement de Données

L'ingénieur est souvent confronté à des masses

considérables de données. La plupart du temps
plusieurs variables (attributs, caractères) ont été
mesurées pour chaque observation. L'étude
individuelle de ces variables, bien qu'essentielle, ne
permet pas de retirer toute l'information désirée de
ce tableau de données.
Objectif du Traitement de Données

Les méthodes bivariables, en particulier les

diagrammes binaires (scatterplots en anglais), sont
déjà beaucoup plus riches d'informations puisqu'elles
permettent d'établir des relations entre les variables.
Les méthodes multivariables vont un peu plus loin et
cherchent les relations simultanées entre plusieurs
variables.
Objectif du Traitement de Données

Ces méthodes ne sont pas le propre des ingénieurs

Financiers; elles peuvent servir à analyser les
données de toute provenance. Elles ont été
développées tout au long du 20e siècle par des
statisticiens et des chercheurs provenant surtout des
domaines suivants: sciences sociales, psychologie,
sciences biologiques et agriculture.
Objectif du Traitement de Données

L'analyse des données vise donc essentiellement à

décrire les liens entre les variables et les
observations de notre matrice de donnée.
Plus précisément, voici une série de questions
auxquelles ces méthodes tenteront de fournir des
réponses:
Objectif du Traitement de Données

1 - Peut-on prédire le comportement d'une variable à

partir d'une ou plusieurs autres variables (problème
de régression)? Quelle est la meilleure équation de
prédiction?
Objectif du Traitement de Données

2 - Peut-on identifier, voir interpréter, des facteurs

pouvant expliquer les variations observées dans les
différentes variables (analyse factorielle)?
Objectif du Traitement de Données

3 - Peut-on filtrer de nos données l'effet dû à des

facteurs indésirables (analyse factorielle)?
Objectif du Traitement de Données

4 - Peut-on identifier les différences existant entre

divers groupes parmi nos données (analyse
discriminante)?
Comment utiliser ces différences pour prédire le
groupe auquel appartient une nouvelle observation?
Objectif du Traitement de Données

5 - Quelles sont les observations (ou les variables)

ayant des ressemblances au niveau de leur
comportement (classification automatique)?
Objectif du Traitement de Données

Ce cours vise à fournir les principaux outils

multivariables nécessaires à l'ingénieur Financier
pour sa pratique professionnelle ou pour ses études
graduées.
Introduction au Data Mining

Data-mining ≡ Fouille de données

Regroupe un ensemble de techniques et d’outils de
la Statistique, l’Informatique et la Science de
l’information
Introduction au Data Mining

A évolué vers le data science

Machine Learning, Data-Mining
Big Data (explosion des données)
Formalismes de stockage et de traitement distribués
des données (NoSQL, Hadoop, MapReduce, Spark ...)
Introduction au Data Mining

Le data-mining est un processus de découverte de

règle, relations, corrélations et/ou dépendances à
travers une grande quantité de données, grâce à des
méthodes statistiques, mathématiques et de
reconnaissances de formes.
Introduction au Data Mining

Le data-mining est un processus d’extractions

automatique d’informations predictives à partir de
grandes bases de données.
Introduction au Data Mining

Données :
Big Data : augmentation sans cesse de données
générées
Twitter : 50M de tweets /jour (=7 téraoctets)
Facebook : 10 téraoctets /jour
Youtube : 50h de vidéos uploadées /minute 2.9
million de mail /seconde
Exemples d’applications en Data Mining

E-Commerce :

Targeting
Stocker les séquences de clicks des visiteurs,
analyser les caractéristiques des acheteurs
Faire du ”targeting” lors de la visite d’un client
potentiel
Exemples d’applications en Data Mining

Détection de fraudes pour les assurances

Analyse des déclarations des assurés par un expert
afin d’identifier les cas de fraudes.
Applications de méthodes statistiques pour identifier
les déclarations fortement corrélées à la fraude.
Processus d’un Projet en Data Mining
Processus d’un Projet en Data Mining

Principales étapes
1- Collecte de données
2- Pré-traitement
3- Analyse statistique
4- Identifier le problème de DM
5- Apprendre le modèle mathématique
6- Évaluer ses capacités
Ensemble de données

Données d’un problème de DM

Les informations sont des exemples avec des
attributs On dispose généralement d’un
ensemble de N données
Ensemble de données

Attributs
Un attribut est un descripteur d’une entité. On
l’appelle également variable, ou caractéristique
Données et Métrique

Les algorithmes nécessitent une notion de

similarité dans l’espace X des données. La
similarité est traduite par la notion de distance.
Données et Métrique

Types d’apprentissage
Apprentissage supervisé
Apprentissage non-supervisé

Vous aimerez peut-être aussi

Cours de Dataming
Pas encore d'évaluation
Cours de Dataming
16 pages
Chap.01 Intro 18-19 1
Pas encore d'évaluation
Chap.01 Intro 18-19 1
17 pages
DataMining CIPMA SAV2 SupportDeCours
Pas encore d'évaluation
DataMining CIPMA SAV2 SupportDeCours
73 pages
Cours de Data Mining : Métier et Données
Pas encore d'évaluation
Cours de Data Mining : Métier et Données
57 pages
Introduction au Data-Mining et ses Méthodes
Pas encore d'évaluation
Introduction au Data-Mining et ses Méthodes
28 pages
Introduction au Data Mining
Pas encore d'évaluation
Introduction au Data Mining
31 pages
Cours de Data Mining
Pas encore d'évaluation
Cours de Data Mining
17 pages
Data Mining
Pas encore d'évaluation
Data Mining
91 pages
Cours de Data Mining 2024-2025
Pas encore d'évaluation
Cours de Data Mining 2024-2025
115 pages
Data Mining Final
100% (1)
Data Mining Final
192 pages
Introduction au Data Mining et ses enjeux
Pas encore d'évaluation
Introduction au Data Mining et ses enjeux
26 pages
Introduction au Data Mining et IA
Pas encore d'évaluation
Introduction au Data Mining et IA
185 pages
Introduction au Data Mining avec R
Pas encore d'évaluation
Introduction au Data Mining avec R
8 pages
Introduction au Data Mining et ses Méthodes
Pas encore d'évaluation
Introduction au Data Mining et ses Méthodes
74 pages
Cours de Data Mining - 1
Pas encore d'évaluation
Cours de Data Mining - 1
37 pages
Introduction au Data Mining et Techniques
Pas encore d'évaluation
Introduction au Data Mining et Techniques
25 pages
Partitionnement des données marketing
Pas encore d'évaluation
Partitionnement des données marketing
25 pages
Leçon 1 WB
Pas encore d'évaluation
Leçon 1 WB
12 pages
01introduction Au Data Mining
Pas encore d'évaluation
01introduction Au Data Mining
9 pages
Data Mining
Pas encore d'évaluation
Data Mining
11 pages
Cours de Fouille de Données Avancée
Pas encore d'évaluation
Cours de Fouille de Données Avancée
96 pages
Data Mining
Pas encore d'évaluation
Data Mining
36 pages
Data Mining
Pas encore d'évaluation
Data Mining
3 pages
Data Mining (Partie 1)
Pas encore d'évaluation
Data Mining (Partie 1)
56 pages
Introduction au Data Mining et ses Techniques
Pas encore d'évaluation
Introduction au Data Mining et ses Techniques
10 pages
Introduction au Data Mining et ses Techniques
Pas encore d'évaluation
Introduction au Data Mining et ses Techniques
10 pages
Data Warehouse et Data Mining expliqués
Pas encore d'évaluation
Data Warehouse et Data Mining expliqués
32 pages
Techniques de Datamining en Cours
Pas encore d'évaluation
Techniques de Datamining en Cours
19 pages
Data Mining
Pas encore d'évaluation
Data Mining
55 pages
Cours de Data Mining en Master 2
Pas encore d'évaluation
Cours de Data Mining en Master 2
20 pages
Cours Data Mining - MORIE
Pas encore d'évaluation
Cours Data Mining - MORIE
88 pages
Introduction à la fouille de données
Pas encore d'évaluation
Introduction à la fouille de données
25 pages
Cours Fouille de Données Partie2
Pas encore d'évaluation
Cours Fouille de Données Partie2
83 pages
Introduction au Data Mining
Pas encore d'évaluation
Introduction au Data Mining
30 pages
Introduction au Data Mining
Pas encore d'évaluation
Introduction au Data Mining
33 pages
Introduction à l'Analyse de Données
Pas encore d'évaluation
Introduction à l'Analyse de Données
57 pages
ChI Data Mining - Versionre
Pas encore d'évaluation
ChI Data Mining - Versionre
31 pages
Data Mining et Machine Learning en 2023
Pas encore d'évaluation
Data Mining et Machine Learning en 2023
6 pages
Introduction au Data Mining et KDD
Pas encore d'évaluation
Introduction au Data Mining et KDD
34 pages
Ch2 Data Mining
Pas encore d'évaluation
Ch2 Data Mining
61 pages
Cours-Data-Mining Master BIBDA 2017 2018
Pas encore d'évaluation
Cours-Data-Mining Master BIBDA 2017 2018
164 pages
Chap1-Introduction Au DataMining Sahbi
Pas encore d'évaluation
Chap1-Introduction Au DataMining Sahbi
47 pages
Introduction au Data Mining et ECD
Pas encore d'évaluation
Introduction au Data Mining et ECD
6 pages
Introduction au Data Mining et KDD
Pas encore d'évaluation
Introduction au Data Mining et KDD
44 pages
Chapitre 6 IA
Pas encore d'évaluation
Chapitre 6 IA
32 pages
Cours sur l'Analyse des Données
Pas encore d'évaluation
Cours sur l'Analyse des Données
46 pages
Introduction au Data Mining et Statistiques
Pas encore d'évaluation
Introduction au Data Mining et Statistiques
36 pages
Data Mining
Pas encore d'évaluation
Data Mining
25 pages
Concepts et Techniques du Data Mining
Pas encore d'évaluation
Concepts et Techniques du Data Mining
30 pages
Chap1 - Introduction Au Data Mining
Pas encore d'évaluation
Chap1 - Introduction Au Data Mining
32 pages
Compréhension Et Préparation Des Données (Partie 1)
Pas encore d'évaluation
Compréhension Et Préparation Des Données (Partie 1)
36 pages
Chapitre 1 DM
Pas encore d'évaluation
Chapitre 1 DM
73 pages
Introduction au Data Mining et ses enjeux
Pas encore d'évaluation
Introduction au Data Mining et ses enjeux
7 pages
Introduction au Data Mining et ses Applications
Pas encore d'évaluation
Introduction au Data Mining et ses Applications
43 pages
Introduction au Data Mining et ses Méthodes
Pas encore d'évaluation
Introduction au Data Mining et ses Méthodes
25 pages
Introduction Au Data Mining
Pas encore d'évaluation
Introduction Au Data Mining
102 pages
Tâches et techniques du Data Mining
Pas encore d'évaluation
Tâches et techniques du Data Mining
16 pages
Data Mining Nemiche
Pas encore d'évaluation
Data Mining Nemiche
267 pages
Introduction à la Statistique Descriptive
Pas encore d'évaluation
Introduction à la Statistique Descriptive
90 pages
05 - ACP Application
Pas encore d'évaluation
05 - ACP Application
19 pages
Comprendre l'ANOVA en statistique
Pas encore d'évaluation
Comprendre l'ANOVA en statistique
22 pages
05 - Statistiques Descriptives
Pas encore d'évaluation
05 - Statistiques Descriptives
24 pages
Licence Professionnelle SIGA à Aïn Chock
Pas encore d'évaluation
Licence Professionnelle SIGA à Aïn Chock
1 page
Transfert et inscription FSJES Kénitra 2019
Pas encore d'évaluation
Transfert et inscription FSJES Kénitra 2019
2 pages
Manuel-Trottino Mon Zebre Rigolo
Pas encore d'évaluation
Manuel-Trottino Mon Zebre Rigolo
15 pages
Recrutement Responsable Économat CHIC
Pas encore d'évaluation
Recrutement Responsable Économat CHIC
5 pages
Rapport de Mission de Supervision - Stage (2024)
Pas encore d'évaluation
Rapport de Mission de Supervision - Stage (2024)
2 pages
Formation Complète sur React en 7 Jours
Pas encore d'évaluation
Formation Complète sur React en 7 Jours
2 pages
Comprendre Le Comportement Du Consommateur (Marketing)
Pas encore d'évaluation
Comprendre Le Comportement Du Consommateur (Marketing)
27 pages
GT 1 CC Cartographie
Pas encore d'évaluation
GT 1 CC Cartographie
3 pages
Lebtsaea
Pas encore d'évaluation
Lebtsaea
31 pages
Manuel d'utilisation du module Abonnement Dolibarr
Pas encore d'évaluation
Manuel d'utilisation du module Abonnement Dolibarr
17 pages
CCTP DPGF Lot 03 Etancheite
Pas encore d'évaluation
CCTP DPGF Lot 03 Etancheite
18 pages
Traitement des Eaux Usées RBS 7000 Usagers
Pas encore d'évaluation
Traitement des Eaux Usées RBS 7000 Usagers
27 pages
Corrige Potdevin
Pas encore d'évaluation
Corrige Potdevin
3 pages
Goc3 250607 PDF
Pas encore d'évaluation
Goc3 250607 PDF
48 pages
Devoir de Traitement Des Eaux - STGP 2022
Pas encore d'évaluation
Devoir de Traitement Des Eaux - STGP 2022
2 pages
Annie Cornu-Leyrit 6 Allée Du Mistral 77176 Savigny-Le-Temple Tel: 01.60.63.32.69 Fax: 01.60.63.55.28 E-Mail: Annie - Cornu@
100% (1)
Annie Cornu-Leyrit 6 Allée Du Mistral 77176 Savigny-Le-Temple Tel: 01.60.63.32.69 Fax: 01.60.63.55.28 E-Mail: Annie - Cornu@
19 pages
Introduction à la POO en PHP
Pas encore d'évaluation
Introduction à la POO en PHP
23 pages
Emploi du Temps Master II FE
Pas encore d'évaluation
Emploi du Temps Master II FE
1 page
TD Lyapunov 56 PDF
100% (2)
TD Lyapunov 56 PDF
2 pages
Planning Chimie Pharmacie PACES 2012-2013
Pas encore d'évaluation
Planning Chimie Pharmacie PACES 2012-2013
5 pages
Perception Segangan Nador - Recherche Google
Pas encore d'évaluation
Perception Segangan Nador - Recherche Google
1 page
Initiative de Bamako
Pas encore d'évaluation
Initiative de Bamako
20 pages
Fiche Technique Des Journees D'activite
Pas encore d'évaluation
Fiche Technique Des Journees D'activite
4 pages
Urb 224
Pas encore d'évaluation
Urb 224
17 pages
Codes téléphoniques par pays
Pas encore d'évaluation
Codes téléphoniques par pays
406 pages
QCM Maths Terminale ES
Pas encore d'évaluation
QCM Maths Terminale ES
1 page
Bilan thermique du corps humain
Pas encore d'évaluation
Bilan thermique du corps humain
35 pages
Chapitre 8 Partie 1 - GENERALITES SUR LES ASSEMBLAGES SOUDES
Pas encore d'évaluation
Chapitre 8 Partie 1 - GENERALITES SUR LES ASSEMBLAGES SOUDES
11 pages
HORIZON PLUS - 2 - Mon Plan Stratégique - Copie
Pas encore d'évaluation
HORIZON PLUS - 2 - Mon Plan Stratégique - Copie
24 pages
Acteurs & Phasage Projet de Construction
Pas encore d'évaluation
Acteurs & Phasage Projet de Construction
59 pages
Analyse de Chromatographie en TP
100% (1)
Analyse de Chromatographie en TP
12 pages
La Responsabilité Du Traducteur
Pas encore d'évaluation
La Responsabilité Du Traducteur
9 pages