Université Abdelmalek Essaâdi
Filière : LST- IDLL
Faculté des Sciences et Techniques d’Al-Hoceima Module : Python pour la science de données
A .U : 2024/2025
Département d'Informatique Pr : ZANNOU Abderrahim
Compte rendu N°1 : Développement d'une Application de Web Scraping
Objectif :
• Le mini-projet consiste à développer une application de web scraping permettant d'extraire des
données à partir d'un site web sélectionné. Les données extraites doivent être sauvegardées dans
un fichier, dans un format libre tel que CSV, JSON, etc.
• L'objectif est de maîtriser les techniques de scraping ainsi que l'enregistrement des données.
Le mini-projet doit être réalisé individuellement (monome) et noté
Étapes du mini-projet
1. Choix du site web :
o Chaque étudiant (e) doit sélectionner un site web qui permet le scraping
o Les sites doivent contenir des informations pertinentes à scraper (météo, des commentaires, des
tweets, les prix de données boursiers, etc….)
2. Scraping des données :
o Utiliser l'une des bibliothèques Python telles que Requests, Scrapy , etc, pour extraire les données.
o Les données extraites doivent être organisées et pertinentes
3. Enregistrement sous forme de fichier :
- Les données doivent être sauvegardées dans un format de fichier libre comme CSV,
JSON, ou tout autre format adapté.
4. Rapport du projet :
o Le rapport doit être rédigé en LaTeX via la plateforme Overleaf ([Link] et le
partagé avec l’adresse email: [Link]@[Link].
o Le rapport (3 pages maximum, y compris la page de garde) doit inclure :
⎯ l'objectif de l'application
⎯ Les données à scraper
⎯ Les étapes clés du processus de web scraping.
⎯ Le code de l'application n'est pas inclus
5. Soumission :
o Chaque étudiant (e) doit envoyer trois éléments :
⎯ Le rapport en LaTeX ( Version PDF)
⎯ Le script Python
⎯ Fichier de données scrapées
o Le dernier délai pour envoyer les mini-projets est fixé au 13 octobre 2024 dont l'objet de
transmission "Mini-projet1_votreNom"
1/1