Scraping Web

Photo 1 du projet
Photo 2 du projet
Photo 3 du projet
Photo 4 du projet

Informations de Développement

  • Catégorie: Programmation Informatique
  • Technologies: Python

Description :

Ce projet est un script Python permettant de scraper des informations sur des voitures de marque Audi à partir du site de La Centrale, et de stocker ces informations dans un fichier CSV. Le code utilise les bibliothèques BeautifulSoup, requests et csv. Le script commence par définir une fonction format_url qui prend une page de recherche en entrée et retourne une URL formatée contenant les critères de recherche pour la marque Audi, la puissance minimale, l'année de fabrication minimale et maximale, et l'énergie. Ensuite, il y a une fonction main, qui initialise une liste vide pour stocker les données récupérées. La fonction utilise une boucle pour scraper les 9 premières pages de résultats de recherche (à partir de la page 1) en utilisant la fonction format_url. Pour chaque page de résultat, le script envoie une requête HTTP à l'URL correspondante, analyse le contenu HTML de la réponse à l'aide de la bibliothèque BeautifulSoup, extrait les informations des voitures à partir des éléments HTML appropriés, stocke les informations dans une liste, puis imprime les informations récupérées. Enfin, le script écrit les données collectées dans un fichier CSV nommé "audi.csv" en utilisant la bibliothèque csv. Le script comporte également une condition qui exécute la fonction main si le script est exécuté directement (plutôt que d'être importé en tant que module).