In Python bietet BeautifulSoup leistungsstarke Methoden zum Parsen von HTML-Dokumenten. Wenn Sie mit einem Szenario wie diesem konfrontiert werden, in dem Sie bestimmte Daten aus einer Tabelle abrufen müssen, ist BeautifulSoup praktisch.
Um die gezielte Einzelpostentabelle zu extrahieren, verwenden Sie „soup.find()“ und geben Sie die entsprechenden Attribute innerhalb der Tabelle an Klammern. In diesem Fall benötigen Sie:
table = soup.find("table", {"class": "lineItemsTable"})
Als nächstes können Sie iterieren jede Zeile in der Tabelle mit table.findAll("tr"). Innerhalb jeder Zeile können Sie mit row.findAll("td") auf die Tabellenzellen (td) zugreifen.
Hier ist ein erweiterter Codeausschnitt:
data = []
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele]) # Remove empty values
Dieser Code erstellt eine Liste von Listen, wobei jede Unterliste eine Zeile in der Tabelle darstellt. Es erfasst effizient die erforderlichen Daten von der Website.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3