「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > BeautifulSoup を使用して Python の HTML テーブルからデータを抽出するにはどうすればよいですか?

BeautifulSoup を使用して Python の HTML テーブルからデータを抽出するにはどうすればよいですか?

2024 年 11 月 7 日に公開
ブラウズ:384

How can BeautifulSoup be used to extract data from a HTML table in Python?

BeautifulSoup 解析テーブル

Python では、BeautifulSoup は HTML ドキュメントを解析するための強力なメソッドを提供します。テーブルから特定のデータを取得する必要があるこのようなシナリオに直面した場合、BeautifulSoup が役に立ちます。

ターゲットの項目テーブルを抽出するには、suup.find() を利用し、適切な属性を指定します。括弧。この場合、次のものが必要になります:

table = soup.find("table", {"class": "lineItemsTable"})

次に、次のことを繰り返すことができます。 table.findAll("tr") を使用してテーブル内の各行を取得します。各行内では、 row.findAll("td") を使用してテーブル セル (td) にアクセスできます。

拡張コード スニペットは次のとおりです:

data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values

このコードは、各サブリストがテーブル内の行を表すリストのリストを生成します。ウェブサイトから必要なデータを効率的に取得します。

最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3