Script de Présentation

La collecte de données propres a été nécessaire en raison de l'absence de datasets adaptés aux besoins spécifiques du projet sur le transport en commun au Maroc. Deux étapes ont été suivies : une collecte manuelle d'informations essentielles et l'utilisation de l'API OpenStreetMap pour des données géographiques, suivies de l'augmentation et de la génération de données synthétiques via CTGAN. Cette approche a permis de créer un dataset final de 100 lignes, garantissant des analyses précises et une interface robuste.

Transféré par

elmansouri.aya

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

33 vues2 pages

Script de Présentation

Transféré par

elmansouri.aya

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Script de Présentation

Pourquoi collecter nos propres données ?

Alors, pourquoi avons-nous dû collecter nos propres données ? Tout

simplement parce que nous n'avons pas trouvé de dataset prêt à l'emploi
qui corresponde à nos besoins spécifiques. Cette situation, bien
qu'exigeante, nous a permis de concevoir une base de données adaptée
aux objectifs du projet et de mieux comprendre les caractéristiques et les
contraintes du transport en commun au Maroc.

Avant de commencer la collecte, nous avons défini des paramètres

essentiels pour structurer notre base de données. Ces choix étaient
guidés par les objectifs du projet et la nécessité de disposer d'une vue
claire et exploitable des transports en commun au Maroc. Parmi ces
paramètres :

 Les données géographiques : comme la localisation exacte des

infrastructures (arrêts, gares, stations).
 Les moyens de transport disponibles : leur type (bus,
tramways, taxis) et leur nombre par région.
 Le flux de passagers : pour comprendre les usages quotidiens et
identifier les zones de forte demande.

Ces paramètres nous ont permis de mieux cibler notre collecte et

d'assurer que les données recueillies répondraient à nos besoins
spécifiques.

La collecte des données a été réalisée en deux grandes étapes :

Premièrement, nous avons effectué une collecte manuelle. Nous avons

consulté des sources fiables comme les sites web officiels des opérateurs
de transport tels qu'Alsa et les tramways de Casablanca et Rabat, ainsi
que des rapports locaux. Grâce à cela, nous avons pu recueillir des
informations essentielles, telles que :

 Le nombre de bus, tramways, trains, grands et petits taxis dans

chaque région.
 Le nombre et l’emplacement des arrêts et stations.
 Le flux de passagers journaliers pour chaque type de transport.
Deuxièmement, nous avons complété cette collecte avec l'utilisation de
l'API OpenStreetMap. Cet outil nous a permis d'obtenir des données
géographiques précises, comme la localisation des gares, des arrêts de
bus et des stations de tramway.

Notre dataset initial comportait seulement cinq lignes de données

réelles. Ces données étaient insuffisantes pour entraîner un modèle
génératif tel que CTGAN. C'est pourquoi nous avons décidé d'augmenter
les données en créant cinq copies de chaque ligne, avec des variations
bien contrôlées pour introduire une certaine diversité. Cette première
étape nous a permis d'obtenir 25 lignes de données augmentées.

Ensuite, nous avons utilisé CTGAN (Conditional Tabular Generative

Adversarial Network) pour générer des données synthétiques
supplémentaires. Ce modèle a été choisi pour sa capacité à gérer des
datasets tabulaires avec des relations complexes entre variables, tout en
générant des données réalistes et variées qui respectent les distributions
initiales. Grâce à ce modèle, nous avons créé un dataset final de 100
lignes, contenant des données réalistes tout en préservant les relations
complexes entre les variables. Cette approche nous a permis de disposer
d'un volume de données suffisant pour nos analyses et visualisations.

Pour nous assurer de la qualité de nos données, nous avons mené

plusieurs évaluations. Tout d'abord, nous avons comparé les distributions
des données réelles et synthétiques pour vérifier leur similarité. Ensuite,
nous avons analysé les corrélations entre les variables pour valider leur
cohérence logique. Enfin, nous avons examiné la diversité et la
confidentialité des données synthétiques pour garantir qu'elles ne
reproduisaient pas directement les données réelles.

En conclusion, cette phase de collecte, d'augmentation et de génération

des données a été essentielle pour poser les bases solides de notre projet.
Grâce à ces données, nous avons pu développer des analyses précises et
une interface robuste, comme vous le verrez dans la suite de cette
présentation.

Je vous remercie pour votre attention et je laisse maintenant la parole à

[nom du collègue suivant] pour la suite.

Vous aimerez peut-être aussi

Rapport - Groupe 8 - Master MIT 2024-25
Pas encore d'évaluation
Rapport - Groupe 8 - Master MIT 2024-25
42 pages
M2 - 2024 - 2025 - Sujet Mastère Big Data Et IA
Pas encore d'évaluation
M2 - 2024 - 2025 - Sujet Mastère Big Data Et IA
19 pages
Collecte et Classification de Données Visuelles
Pas encore d'évaluation
Collecte et Classification de Données Visuelles
35 pages
Rapport Du TP
Pas encore d'évaluation
Rapport Du TP
13 pages
Transport
Pas encore d'évaluation
Transport
1 page
Report Template
Pas encore d'évaluation
Report Template
40 pages
Dossier Competence
Pas encore d'évaluation
Dossier Competence
4 pages
Projet - AHBACH - AITZAABOUL - MACHINE LEARNING
Pas encore d'évaluation
Projet - AHBACH - AITZAABOUL - MACHINE LEARNING
51 pages
Analyse Avis Client
Pas encore d'évaluation
Analyse Avis Client
30 pages
Feature Engineering.: Importation Des Bibliothèques
Pas encore d'évaluation
Feature Engineering.: Importation Des Bibliothèques
5 pages
Avis sur la gouvernance des données clients
Pas encore d'évaluation
Avis sur la gouvernance des données clients
61 pages
CV - 1633611220 2
Pas encore d'évaluation
CV - 1633611220 2
1 page
TD Apprentissage
Pas encore d'évaluation
TD Apprentissage
8 pages
Intitule Projets Version 2
Pas encore d'évaluation
Intitule Projets Version 2
4 pages
Guide-Memoire Inge
Pas encore d'évaluation
Guide-Memoire Inge
9 pages
Pfa 1
Pas encore d'évaluation
Pfa 1
22 pages
Projet de Data Mining : RUL et Musique
Pas encore d'évaluation
Projet de Data Mining : RUL et Musique
3 pages
Rendu de Rapport Cytech Template Saidsalimo
Pas encore d'évaluation
Rendu de Rapport Cytech Template Saidsalimo
4 pages
Compte Rendu Examen TP
Pas encore d'évaluation
Compte Rendu Examen TP
5 pages
Rapport Iheb
Pas encore d'évaluation
Rapport Iheb
103 pages
eMBI Generation Des Donnees 26 06 2021
Pas encore d'évaluation
eMBI Generation Des Donnees 26 06 2021
86 pages
Compte Rendu Examen TP
Pas encore d'évaluation
Compte Rendu Examen TP
5 pages
Projet Data Science Avec Méthode CRISP
Pas encore d'évaluation
Projet Data Science Avec Méthode CRISP
23 pages
Analyse de Sentiments Sur Des Avis Clients
Pas encore d'évaluation
Analyse de Sentiments Sur Des Avis Clients
42 pages
Canevas Du Projet de Recherche en Vue Du Doctorat - Ensak - Bigdata - 09122019
Pas encore d'évaluation
Canevas Du Projet de Recherche en Vue Du Doctorat - Ensak - Bigdata - 09122019
6 pages
Rapport Datasets
Pas encore d'évaluation
Rapport Datasets
13 pages
Guide Memoire - Im Master Pro
Pas encore d'évaluation
Guide Memoire - Im Master Pro
9 pages
Kadia Rapport-Fin Last
100% (1)
Kadia Rapport-Fin Last
46 pages
ML Description Projet Final
Pas encore d'évaluation
ML Description Projet Final
33 pages
Partie
Pas encore d'évaluation
Partie
4 pages
Différentes Phases de L' Analyse
Pas encore d'évaluation
Différentes Phases de L' Analyse
3 pages
Analyse Big Data des trajets de taxis NYC
Pas encore d'évaluation
Analyse Big Data des trajets de taxis NYC
2 pages
DT Lincoln FOU
Pas encore d'évaluation
DT Lincoln FOU
4 pages
Rapport de Staage 23-24
Pas encore d'évaluation
Rapport de Staage 23-24
37 pages
Mini Projet ML
Pas encore d'évaluation
Mini Projet ML
3 pages
Rapport
Pas encore d'évaluation
Rapport
36 pages
TP Ia
Pas encore d'évaluation
TP Ia
5 pages
Rapport Pfe BI
Pas encore d'évaluation
Rapport Pfe BI
144 pages
Test de Préselection MCS - Développeur Data Projet Sourcing
Pas encore d'évaluation
Test de Préselection MCS - Développeur Data Projet Sourcing
3 pages
Rapport de Master sur Big Data chez Orange
Pas encore d'évaluation
Rapport de Master sur Big Data chez Orange
68 pages
Samy V2
Pas encore d'évaluation
Samy V2
65 pages
Processus de la Data Science en Finance
Pas encore d'évaluation
Processus de la Data Science en Finance
62 pages
Rapport Kmar
Pas encore d'évaluation
Rapport Kmar
32 pages
AndreettaFontana Uqac 0862N 10926
Pas encore d'évaluation
AndreettaFontana Uqac 0862N 10926
75 pages
TP 8
Pas encore d'évaluation
TP 8
4 pages
Étapes Pour Le Projet
Pas encore d'évaluation
Étapes Pour Le Projet
4 pages
Résolution du problème du voyageur de commerce
100% (1)
Résolution du problème du voyageur de commerce
49 pages
Slides Dashboard Vas Updated
Pas encore d'évaluation
Slides Dashboard Vas Updated
19 pages
Résumé en Français
Pas encore d'évaluation
Résumé en Français
3 pages
Projet NoSQL: MongoDB, Cassandra, Elastic
Pas encore d'évaluation
Projet NoSQL: MongoDB, Cassandra, Elastic
9 pages
Travail Optimisation Transports Urbains Complet
Pas encore d'évaluation
Travail Optimisation Transports Urbains Complet
6 pages
Systeme 112
Pas encore d'évaluation
Systeme 112
8 pages
HADINE Houda DataEngineer
Pas encore d'évaluation
HADINE Houda DataEngineer
1 page
Ai TP1 2024
Pas encore d'évaluation
Ai TP1 2024
5 pages
Cour 2
Pas encore d'évaluation
Cour 2
15 pages
TD3 Corriger
Pas encore d'évaluation
TD3 Corriger
2 pages
Recapitulatif Graphes C BFS DFS
Pas encore d'évaluation
Recapitulatif Graphes C BFS DFS
2 pages
Exercice 1: Est - Pair (X) Pair Ou Impair. Est-Pair 1 Nombre Pair 0 Nombre Impair
Pas encore d'évaluation
Exercice 1: Est - Pair (X) Pair Ou Impair. Est-Pair 1 Nombre Pair 0 Nombre Impair
1 page
Fiche de Renseignements-Licence
Pas encore d'évaluation
Fiche de Renseignements-Licence
1 page
Série 2
Pas encore d'évaluation
Série 2
10 pages
QCM Informatique
100% (1)
QCM Informatique
17 pages
Epreuve Français
Pas encore d'évaluation
Epreuve Français
2 pages
Rapport D'avancement Projet D'analyse Prédictive Des Matchs
Pas encore d'évaluation
Rapport D'avancement Projet D'analyse Prédictive Des Matchs
5 pages
Atelier3-2 Ajax PHP
Pas encore d'évaluation
Atelier3-2 Ajax PHP
2 pages
Cours 1 Langage PHP
Pas encore d'évaluation
Cours 1 Langage PHP
63 pages
Atelier4 Poo PHP
Pas encore d'évaluation
Atelier4 Poo PHP
2 pages
Methode Travaille Prjt-Foot
Pas encore d'évaluation
Methode Travaille Prjt-Foot
2 pages
Data Generation
Pas encore d'évaluation
Data Generation
2 pages
Nouvelle Policière
Pas encore d'évaluation
Nouvelle Policière
6 pages
Choix Du Dataset
Pas encore d'évaluation
Choix Du Dataset
6 pages
Questions À Poser
Pas encore d'évaluation
Questions À Poser
4 pages
Guide - KNN - KMeans Sara
Pas encore d'évaluation
Guide - KNN - KMeans Sara
20 pages
Spectral Clustering
Pas encore d'évaluation
Spectral Clustering
5 pages
CCN°1 Analyse4.2018
Pas encore d'évaluation
CCN°1 Analyse4.2018
2 pages
Miniprojet #2
Pas encore d'évaluation
Miniprojet #2
11 pages
Nouvelle Policière
Pas encore d'évaluation
Nouvelle Policière
1 page
Analyse4 TD3
Pas encore d'évaluation
Analyse4 TD3
1 page
TD Série 2
Pas encore d'évaluation
TD Série 2
1 page
Analyse4 CC in
Pas encore d'évaluation
Analyse4 CC in
1 page
Analyse 4 TD.
Pas encore d'évaluation
Analyse 4 TD.
10 pages
Cours 4 - Programmation Shell
Pas encore d'évaluation
Cours 4 - Programmation Shell
21 pages
Analyse4 CC in
Pas encore d'évaluation
Analyse4 CC in
1 page
Configuration d'un réseau IoT avec Packet Tracer
Pas encore d'évaluation
Configuration d'un réseau IoT avec Packet Tracer
5 pages
TP2 Réseau
Pas encore d'évaluation
TP2 Réseau
5 pages
Wolikow, Serge (Coordinador) - Une Histoire en Revolution. Du Bon Usage Des Archives, de Moscou Et D'ailleurs
Pas encore d'évaluation
Wolikow, Serge (Coordinador) - Une Histoire en Revolution. Du Bon Usage Des Archives, de Moscou Et D'ailleurs
309 pages
Compréhension Écrite - Volume 4
Pas encore d'évaluation
Compréhension Écrite - Volume 4
275 pages
Présentation et Nationalités
Pas encore d'évaluation
Présentation et Nationalités
5 pages
Sujet D'examen 1ère Session
Pas encore d'évaluation
Sujet D'examen 1ère Session
3 pages
Liberté : Fondement de la Dignité Humaine
Pas encore d'évaluation
Liberté : Fondement de la Dignité Humaine
3 pages
Pauvrete - Et - Inegalites - Sociales 2
Pas encore d'évaluation
Pauvrete - Et - Inegalites - Sociales 2
21 pages
Modele de Facture Vierge
Pas encore d'évaluation
Modele de Facture Vierge
1 page
Guide de l'amortissement comptable
Pas encore d'évaluation
Guide de l'amortissement comptable
13 pages
Examen Du Bts 2012
Pas encore d'évaluation
Examen Du Bts 2012
6 pages
Biographie de PEDRO PUIG ADAM
Pas encore d'évaluation
Biographie de PEDRO PUIG ADAM
3 pages
Plan de Redaction Du Protocole Pour Les BTS
Pas encore d'évaluation
Plan de Redaction Du Protocole Pour Les BTS
3 pages
Atelier Grafcet SoMachine
Pas encore d'évaluation
Atelier Grafcet SoMachine
36 pages
Ulysse Et Le Cyclope Polyphème
Pas encore d'évaluation
Ulysse Et Le Cyclope Polyphème
2 pages
Olympe de Gouges DDFC Oral Texte 1 + Coprrigé
Pas encore d'évaluation
Olympe de Gouges DDFC Oral Texte 1 + Coprrigé
5 pages
Trading The Gartley Pattern - Aa
Pas encore d'évaluation
Trading The Gartley Pattern - Aa
11 pages
Exposé 3 Conditions D - Exercice Des Compétences Attribuées Aux Collectivités Territoriales
Pas encore d'évaluation
Exposé 3 Conditions D - Exercice Des Compétences Attribuées Aux Collectivités Territoriales
12 pages
Examen d'analyse financière BTS
Pas encore d'évaluation
Examen d'analyse financière BTS
1 page
Guérir Les Blessures Affectives
Pas encore d'évaluation
Guérir Les Blessures Affectives
15 pages
Contrat Animatrice
Pas encore d'évaluation
Contrat Animatrice
1 page
54.les Antibiotiques
Pas encore d'évaluation
54.les Antibiotiques
7 pages
EtudesMassalietes3 Pp.199 234
Pas encore d'évaluation
EtudesMassalietes3 Pp.199 234
37 pages
TDR MSF
Pas encore d'évaluation
TDR MSF
2 pages
Examen CDG 2024
Pas encore d'évaluation
Examen CDG 2024
4 pages
Entrée Dans Manon Lescaut
Pas encore d'évaluation
Entrée Dans Manon Lescaut
8 pages
Planification et Contrôle Budgétaire
Pas encore d'évaluation
Planification et Contrôle Budgétaire
64 pages
Diagrammes de phases binaires expliqués
Pas encore d'évaluation
Diagrammes de phases binaires expliqués
69 pages
Capture D'écran . 2025-05-22 À 21.44.58
Pas encore d'évaluation
Capture D'écran . 2025-05-22 À 21.44.58
14 pages
Cas Ipeace
Pas encore d'évaluation
Cas Ipeace
13 pages
Manuel Qualité du Laboratoire Bioxa
Pas encore d'évaluation
Manuel Qualité du Laboratoire Bioxa
34 pages
CRA 1 Dornier Julien OK
Pas encore d'évaluation
CRA 1 Dornier Julien OK
2 pages