En Python, BeautifulSoup fournit des méthodes puissantes pour analyser les documents HTML. Face à un scénario comme celui-ci dans lequel vous devez récupérer des données spécifiques d'une table, BeautifulSoup s'avère pratique.
Pour extraire la table des éléments de campagne ciblés, utilisez soup.find(), en spécifiant les attributs appropriés dans le parenthèses. Dans ce cas, vous aurez besoin de :
table = soup.find("table", {"class": "lineItemsTable"})
Ensuite, vous pouvez parcourir chaque ligne du tableau en utilisant table.findAll("tr"). Dans chaque ligne, vous pouvez accéder aux cellules du tableau (td) à l'aide de row.findAll("td").
Voici un extrait de code amélioré :
data = []
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele]) # Remove empty values
Ce code produira une liste de listes, chaque sous-liste représentant une ligne du tableau. Il capturera efficacement les données nécessaires du site Web.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3