P RÉPARATION DE DONNÉES
Introduction & Collecte de données
Statistiques - 4ème année DS - A.U. 2022/2023
Introduction Collecte de données Découverte et évaluation de données.
Introduction
La préparation de données est un processus qui précède celui de l’analyse de
données. Il désigne les opérations de collecte de données, nettoyage et transformation
qui doivent être appliqués aux données brutes avant leur traitement et analyse.
La préparation de données améliore la qualité de données destinées à l’analyse
et à d’autres tâches liées à la gestion des données en éliminant les erreurs et
normalisant les données brutes avant leur traitement.
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
Les étapes de préparation de données
① Collecte de données.
② Découverte et évaluation de données.
③ Nettoyage et validation de données
④ Transformation et enrichissement de données.
⑤ Stockage de données.
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
Collecte de données
La collecte de données sur le terrain consiste à recueillir des informations
permettant d’évaluer l’état d’une situation grâce à des descentes sur le terrain.
Ceci se fait généralement à l’aide d’un questionnaire d’enquête pré rédigé et
administré par des agents de collecte aux prospects.
Par ailleurs, ce processus de collecte de données s’avère très utile pour identifier les
problèmes sur le terrain et mettre en œuvre les bonnes stratégies et politiques
adaptées pour les résoudre.
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
Organisation de données
Les données à analyser sont organisées sous deux formes différentes:
Données structurées :
Toutes informations (mots, chiffres. . . ) présentées dans des cases (les champs
d’un tableau) qui permettent leur interprétation et leur traitement. Plus simple-
ment un tableau individus X variable.
Données non structurées:
Tout ce qui n’est pas organisé sous forme d’un tableau de données la messagerie,
les images, les vidéos, etc. . .
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
Types de données
Pour lancer toute opération collecte de données, il faut d’abord déterminer le type de
données à collecter qui sont soit qualitatives, quantitatives ou mixtes.
Les deux types de données :
☛ Données qualitatives
☛ Données quantitatives
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
Types de données
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
Données quantitatives
La première étape du processus de recherche quantitative consiste à déterminer
votre méthode et plan d’échantillonnage.
Quoique les données quantitatives représentent des événements bien définis tels
qu’un dénombrement, ou des questions binaires (oui / non), etc.
Exemple: Combien de fois vous avez participé à une enquête de satisfaction ?
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
Données qualitatives
Une donnée qualitative est très souvent utilisée pour comprendre les raisons, les
opinions et les motivations dans des situations quelconques. Elles fournissent des
informations plus ou moins claires sur certains problèmes spécifiques.
Quel que soit le type de données que vous voulez collecter, il faut utiliser une
méthode donnée. Il n’en existe pas de « meilleure » mais chaque méthode a ses
propres avantages et inconvénients.
Il est conseillé d’orienter votre choix en fonction du type de données (données
qualitatives ou quantitatives) que vous devez collecter.
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
10
Méthodes de recherche qualitative
Les entretiens approfondis:
Grâce à ces entretiens approfondis, vous récupérez autant d’informations à l’aide
de questions ouvertes posées directement à des personnes.
Ces entretiens en face à face, sont parfois longs et coûteux, mais vous aurez un
taux de réponse très élevé.
Observations avancées:
Quelques fois, on fait appel à des experts pour effectuer des observations pointues
et de fournir des commentaires à base de leur expertise.
Exemple: l’état d’un équipement, un expert pourra donner plus de détails sur les
causes du dysfonctionnement.
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
11
Méthodes de recherche quantitative
Les enquêtes avec questions fermées:
Les questionnaires bien structurés et normalisés vous permettent de minimiser
les risques de données inexactes ou inutiles en facilitant la réponse des enquêtés.
Les tests ou expériences:
Mesurer le nombre de personnes ayant réussi un test ou ayant répondu de façon
adéquate à une question (ou à un ensemble de questions) est une autre façon de
collecter des données quantitatives.
Vous pourriez collecter des informations telles que l’âge, situation profession-
nelle, le niveau d’éducation, etc., des participants lorsque vous effectuez des tests
ou expériences.
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
12
Méthodes de recherche quantitative
Les sondages :
Les sondages sont une autre méthode efficace pour la collecte de données. Ils
peuvent être menés en ligne, par téléphone ou en personne. Les sondages télé-
phoniques sont rentables et prennent moins de temps que les entretiens en face
à face. Cependant, le taux de réponse aux sondages téléphoniques est plus faible.
Les sondages en ligne sont moins onéreux et peuvent être envoyés à un grand
nombre de personnes.
@UP-Maths Préparation de données Statistiques
Introduction Collecte de données Découverte et évaluation de données.
13
Découverte et évaluation des données
Lorsque les données ont été collectées, il est important de découvrir les différents
datasets.
Cette étape permet de mieux connaître les données et de déterminer le
traitement à leur appliquer avant qu’elles deviennent exploitables dans un contexte
particulier.
@UP-Maths Préparation de données Statistiques