"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > Programación > ¿Cómo se puede utilizar BeautifulSoup para extraer datos de una tabla HTML en Python?

¿Cómo se puede utilizar BeautifulSoup para extraer datos de una tabla HTML en Python?

Publicado el 2024-11-07
Navegar:725

How can BeautifulSoup be used to extract data from a HTML table in Python?

Tabla de análisis de BeautifulSoup

En Python, BeautifulSoup proporciona métodos potentes para analizar documentos HTML. Cuando se enfrenta a un escenario como este en el que necesita recuperar datos específicos de una tabla, BeautifulSoup resulta útil.

Para extraer la tabla de artículos de línea específicos, utilice sopa.find(), especificando los atributos apropiados dentro del paréntesis. En este caso, necesitará:

table = soup.find("table", {"class": "lineItemsTable"})

A continuación, puede iterar sobre cada fila de la tabla usando table.findAll("tr"). Dentro de cada fila, puede acceder a las celdas de la tabla (td) usando row.findAll("td").

Aquí hay un fragmento de código mejorado:

data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values

Este código producirá una lista de listas, donde cada sublista representa una fila en la tabla. Capturará eficientemente los datos necesarios del sitio web.

Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3