XPath를 사용하여 CSS 클래스별로 요소 찾기
웹 스크래핑에서는 CSS 클래스를 기반으로 HTML 요소를 찾아야 하는 경우가 많습니다. XML 및 HTML 문서를 탐색하기 위한 강력한 도구인 XPath는 이를 달성하는 방법을 제공합니다.
"Test"라는 클래스가 있는 div 요소가 있는 HTML 페이지를 생각해 보세요. 다음 XPath 쿼리를 사용하여 이 요소를 찾을 수 있습니다.
//*[contains(@class, 'Test')]
이 쿼리는 "Test" 클래스를 포함하는 모든 요소를 선택합니다. , 문서 트리에 나타나는 위치에 관계없이.
성능을 최적화하려면 검색 범위를 div와 같은 특정 요소 유형으로 좁힐 수 있습니다. 예를 들어, 다음 쿼리는 "Test" 클래스를 포함하는 div로 검색을 제한합니다:
//div[contains(@class, 'Test')]
그러나 "Testvalue" 또는 "newTest"와 같은 클래스가 있는 요소의 경우 위 쿼리도 해당 요소와 일치합니다. 보다 정확한 일치를 보장하려면 @Tomalak에서 제안한 대로 "Test" 클래스 앞뒤에 공백이 포함된 연결된 문자열을 사용할 수 있습니다:
//div[contains(concat(' ', @class, ' '), ' Test ')]
이 쿼리는 별도의 클래스 값으로 "Test"라는 단어가 있는 div와만 일치합니다.
공백 문제가 있는 경우 @Terry:
//div[contains(concat(' ', normalize-space(@class), ' '), ' Test ')]
마지막으로, 쿼리의 모든 요소를 검색하려는 경우가 아니면 이 쿼리의 별표(*)를 일치시키려는 실제 요소 이름으로 바꾸는 것이 중요합니다. 문서. 이렇게 하면 쿼리 효율성이 향상됩니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3