Exposé détaillé : Chapitre 2 - Intégration de données externes
I. Introduction
Aujourd'hui, nous vivons dans un monde numérique où les données sont générées en grande quantité
à partir de plusieurs sources : applications métiers, sites web, bases de données, fichiers bureautiques,
objets connectés, etc. Pour analyser ces données efficacement, il faut d'abord les intégrer dans un
environnement unique, propre, et structuré.
L’intégration de données consiste donc à connecter, importer, fusionner, et transformer des données
provenant de sources différentes pour les rendre exploitables. Dans le cadre de ce cours, cette
opération se fait principalement via Power Query dans Excel ou Power BI.
➡️ Objectif de ce chapitre : vous apprendre à identifier les différentes sources de données, à comprendre
les méthodes d’intégration, et à utiliser Power Query pour importer et préparer les données à analyser.
II. Les différentes sources de données
1. Sources et sorties possibles
Sources possibles :
• Fichiers Excel (.xlsx, .xls)
• Fichiers texte (.csv, .txt)
• Fichiers XML ou JSON
• Bases de données relationnelles (SGBDR)
• Dossiers contenant plusieurs fichiers
• Services Web (API, flux RSS)
Sorties possibles après traitement :
• Power Pivot (modèle de données)
• Tableaux croisés dynamiques
• Graphiques dynamiques
• Rapports Power BI interactifs
➡️ Avantage : un flux de données automatisé, mis à jour régulièrement.
2. Données Excel locales ou distantesFichier local : un simple fichier Excel stocké sur votre disque dur.
• Fichier distant : fichier stocké dans le cloud (OneDrive, Google Drive, SharePoint).
• Exemple d’utilisation : une entreprise suit ses ventes hebdomadaires via un fichier Excel
partagé sur le cloud. Power Query peut se connecter à ce fichier, même à distance.
✅ À savoir : Power Query permet de filtrer, transformer et actualiser les données automatiquement à
chaque ouverture du rapport.
1
3. Fichiers texte ou XML
• CSV (Comma-Separated Values) : très utilisé pour exporter/importer des données simples.
Exemple : liste de clients, ventes, inventaire.
• Fichiers texte (.txt) : structure similaire au CSV, mais souvent avec des séparateurs différents.
• Fichiers XML : plus structurés, utilisés dans les logiciels métiers (ERP, CRM...).
➡️ Power Query peut reconnaître la structure et vous proposer de choisir les nœuds ou tables à
importer.
4. Bases de données relationnelles (SGBDR)
• Types courants : SQL Server, MySQL, PostgreSQL, Oracle, Access.
• Utilisation : connexion via adresse du serveur, identifiants, choix de la base, puis des tables.
• Exemple : un gestionnaire connecte Power BI à une base de données de stock en temps réel.
✅ Avantage : gestion de gros volumes de données + possibilités d’actualisation automatique + langage
SQL si besoin.
5. Autres sources : Dossier et Services Web
• Dossier : permet de charger tous les fichiers d’un même dossier (ex : les 12 fichiers mensuels de
ventes).
• API / Web : permet de récupérer des données externes (exemple : taux de change, météo,
réseaux sociaux) en JSON ou XML.
• Exemples :
• API Météo → pour croiser les données climatiques avec les ventes de produits saisonniers
• Données JSON issues d’un système de paiement en ligne
III. Exploitation après intégration
Une fois les données bien intégrées, plusieurs actions sont possibles :
• Nettoyage : suppression doublons, lignes vides, renommage de colonnes, formatage
• Fusion de plusieurs sources (jointure de tables)
• Ajout de colonnes personnalisées (calculs, conditions)
• Création de tableaux croisés dynamiques
• Visualisations dynamiques dans Power BI (graphique, carte, jauge, etc.)
➡️ Tout cela est possible dans Power Query avant même l’analyse finale.
IV. Cas pratique proposé (démo facultative)
1. Importer un fichier CSV contenant les ventes mensuelles
2. Supprimer les lignes vides, changer les types de données
3. Ajouter une colonne de calcul automatique : Total = Quantité × Prix Unitaire
4. Joindre à une deuxième table contenant les informations produit
5. Afficher un graphique croisé des ventes par produit et par mois
2
V. Conclusion
L’intégration des données est un prérequis fondamental dans tout projet d’analyse ou de reporting.
Elle garantit la fiabilité, la cohérence, et l’accessibilité des données.
Maîtriser Power Query permet de :
• Gagner du temps
• Éviter les erreurs manuelles
• Créer des rapports dynamiques et automatisés
➡️ C’est une compétence recherchée dans les domaines de la gestion, de l’analyse financière, du marketing, et
de la logistique.
Bibliographie recommandée
• Power Query et le langage M – Cathy Monier (Éditions ENI)
• Power BI Desktop – André Meyer
• Data visualisation – Nathan Yau (Eyrolles)
• OpenClassrooms – Cours gratuits en ligne sur Excel, Power BI et analyse de données