Python에서 BeautifulSoup는 HTML 문서를 구문 분석하는 강력한 방법을 제공합니다. 테이블에서 특정 데이터를 검색해야 하는 이와 같은 시나리오에 직면했을 때 BeautifulSoup가 유용합니다.
타겟팅된 광고 항목 테이블을 추출하려면 Soup.find()를 활용하고 괄호. 이 경우에는 다음이 필요합니다.
table = soup.find("table", {"class": "lineItemsTable"})
다음으로 반복할 수 있습니다. table.findAll("tr")을 사용하여 테이블의 각 행. 각 행 내에서 row.findAll("td")를 사용하여 테이블 셀(td)에 액세스할 수 있습니다.
다음은 향상된 코드 조각입니다.
data = []
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele]) # Remove empty values
이 코드는 각 하위 목록이 테이블의 행을 나타내는 목록 목록을 생성합니다. 웹사이트에서 필요한 데이터를 효율적으로 캡처합니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3