पायथन में, BeautifulSoup HTML दस्तावेज़ों को पार्स करने के लिए शक्तिशाली तरीके प्रदान करता है। जब इस तरह के परिदृश्य का सामना करना पड़ता है, जहां आपको किसी तालिका से विशिष्ट डेटा पुनर्प्राप्त करने की आवश्यकता होती है, तो BeautifulSoup काम आता है। कोष्ठक इस मामले में, आपको इसकी आवश्यकता होगी:
table = soup.find('table', {'class': 'lineItemsTable'})table = soup.find("table", {"class": "lineItemsTable"})
यहां एक उन्नत कोड स्निपेट है:
data = [] टेबल_बॉडी = टेबल.फाइंड('टीबॉडी') पंक्तियाँ = टेबल_बॉडी.फाइंड_ऑल('tr') पंक्तियों में पंक्ति के लिए: cols = row.find_all('td') cols = [ele.text.strip() ele in cols] data.append([ele for ele in cols if ele]) # खाली मान हटाएंdata = []
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele]) # Remove empty values
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3