पाइथन के साथ वेब स्क्रैपिंग
प्रश्न: पायथॉन के साथ वेबसाइटों से दैनिक सूर्योदय/सूर्यास्त का समय निकालना
आप वास्तव में वेब सामग्री को परिमार्जन करने और सूर्योदय/सूर्यास्त के समय जैसे डेटा निकालने के लिए पायथन की शक्ति का उपयोग कर सकते हैं वेबसाइटें।
पायथन वेब स्क्रैपिंग की सुविधा के लिए मॉड्यूल का एक व्यापक सेट प्रदान करता है। आइए कुछ प्रमुख विकल्पों पर गौर करें:
प्रयोग योग्य मॉड्यूल:
उदाहरण:
नीचे दिया गया कोड दर्शाता है कि पायथन और उपरोक्त मॉड्यूल का उपयोग करके सूर्योदय/सूर्यास्त का समय कैसे निकाला जाए:
import urllib2
from BeautifulSoup import BeautifulSoup
# Open the target website
soup = BeautifulSoup(urllib2.urlopen('http://example.com').read())
# Extract the relevant table using class name
table = soup('table', {'class': 'spad'})[0]
# Iterate over each row in the table
for row in table.findAll('tr'):
# Extract the date and sunrise time
tds = row.findAll('td')
print(tds[0].string, tds[1].string)
ट्यूटोरियल:
आगे मार्गदर्शन के लिए, इन उपयोगी ट्यूटोरियल पर विचार करें:
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3