«Если рабочий хочет хорошо выполнять свою работу, он должен сначала заточить свои инструменты» — Конфуций, «Аналитики Конфуция. Лу Лингун»
титульная страница > программирование > Как можно использовать BeautifulSoup для извлечения данных из таблицы HTML в Python?

Как можно использовать BeautifulSoup для извлечения данных из таблицы HTML в Python?

Опубликовано 7 ноября 2024 г.
Просматривать:293

How can BeautifulSoup be used to extract data from a HTML table in Python?

Таблица синтаксического анализа BeautifulSoup

В Python BeautifulSoup предоставляет мощные методы для анализа HTML-документов. Когда вы сталкиваетесь с подобным сценарием, когда вам нужно получить определенные данные из таблицы, BeautifulSoup может пригодиться.

Чтобы извлечь таблицу целевых позиций, используйте суп.find(), указав соответствующие атрибуты внутри скобки. В этом случае вам понадобится:

table = soup.find("table", {"class": "lineItemsTable"})

Далее вы можете перебрать каждую строку таблицы с помощью table.findAll("tr"). Внутри каждой строки вы можете получить доступ к ячейкам таблицы (td), используя row.findAll("td").

Вот расширенный фрагмент кода:

data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values

Этот код создаст список списков, где каждый подсписок представляет строку в таблице. Он эффективно соберет необходимые данные с веб-сайта.

Последний учебник Более>

Изучайте китайский

Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.

Copyright© 2022 湘ICP备2022001581号-3