En Python, BeautifulSoup proporciona métodos potentes para analizar documentos HTML. Cuando se enfrenta a un escenario como este en el que necesita recuperar datos específicos de una tabla, BeautifulSoup resulta útil.
Para extraer la tabla de artículos de línea específicos, utilice sopa.find(), especificando los atributos apropiados dentro del paréntesis. En este caso, necesitará:
table = soup.find("table", {"class": "lineItemsTable"})
A continuación, puede iterar sobre cada fila de la tabla usando table.findAll("tr"). Dentro de cada fila, puede acceder a las celdas de la tabla (td) usando row.findAll("td").
Aquí hay un fragmento de código mejorado:
data = []
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele]) # Remove empty values
Este código producirá una lista de listas, donde cada sublista representa una fila en la tabla. Capturará eficientemente los datos necesarios del sitio web.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3