"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Python의 HTML 테이블에서 데이터를 추출하는 데 BeautifulSoup을 어떻게 사용할 수 있나요?

Python의 HTML 테이블에서 데이터를 추출하는 데 BeautifulSoup을 어떻게 사용할 수 있나요?

2024-11-07에 게시됨
검색:437

How can BeautifulSoup be used to extract data from a HTML table in Python?

BeautifulSoup 구문 분석 테이블

Python에서 BeautifulSoup는 HTML 문서를 구문 분석하는 강력한 방법을 제공합니다. 테이블에서 특정 데이터를 검색해야 하는 이와 같은 시나리오에 직면했을 때 BeautifulSoup가 유용합니다.

타겟팅된 광고 항목 테이블을 추출하려면 Soup.find()를 활용하고 괄호. 이 경우에는 다음이 필요합니다.

table = soup.find("table", {"class": "lineItemsTable"})

다음으로 반복할 수 있습니다. table.findAll("tr")을 사용하여 테이블의 각 행. 각 행 내에서 row.findAll("td")를 사용하여 테이블 셀(td)에 액세스할 수 있습니다.

다음은 향상된 코드 조각입니다.

data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values

이 코드는 각 하위 목록이 테이블의 행을 나타내는 목록 목록을 생성합니다. 웹사이트에서 필요한 데이터를 효율적으로 캡처합니다.

최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3