"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > वेब स्क्रैपिंग- दिलचस्प!

वेब स्क्रैपिंग- दिलचस्प!

2024-11-06 को प्रकाशित
ब्राउज़ करें:742

एक अच्छा शब्द:
सीआरओएन = प्रोग्रामिंग तकनीक जो निर्दिष्ट अंतराल पर कार्यों को स्वचालित रूप से शेड्यूल करती है

वेब क्या?

परियोजनाओं आदि पर शोध करते समय, हम आम तौर पर विभिन्न साइटों से जानकारी लिखते हैं - चाहे वह डायरी/एक्सेल/डॉक्टर आदि में हो।
हम वेब को स्क्रैप कर रहे हैं और मैन्युअल रूप से डेटा निकाल रहे हैं।

वेब स्क्रैपिंग इसे स्वचालित कर रही है।

Web scraping- Interesting!

उदाहरण

जब गूगल पर स्नीकर्स ऑनलाइन कहा जाता है, तो यह उत्पादों और कीमतों के साथ वेबसाइटों की एक सूची दिखाता है। शॉपिंग टैब पर अधिक विस्तृत रिकॉर्ड है ना?
Google ने आपके लिए विभिन्न साइटों से स्नीकर्स दिखाने के लिए बस वेबसाइटें निकाली हैं।
इस techinque का उपयोग लगभग सभी बड़ी कंपनियां अपने व्यवसायों के लिए करती हैं क्योंकि डेटा तेजी से बढ़ रहा है।

वेब क्रॉलर

यह एक ऐसी तकनीक है जो हालांकि जानकारी प्राप्त करती है लेकिन स्क्रैपिंग से इस अर्थ में भिन्न है कि यह सर्वोत्तम वेबसाइटों की खोज करती है और उन्हें अनुक्रमित करती है जबकि स्क्रैपिंग एक ही वेबसाइट में की जाती है।

इसका उपयोग एसईओ विश्लेषण (स्क्रैपिंग - डेटा एकत्र करना) के लिए किया जाता है।

प्रसिद्ध वेब स्क्रैपिंग प्रौद्योगिकियां:

  • कठपुतली
  • खूबसूरत सूप
  • ब्राइटडेटा

समस्याएँ!

ध्यान दें कि यह कोई उपयोगकर्ता नहीं है जो साइट से जानकारी प्राप्त करने का अनुरोध कर रहा है, यह कोड लिखा हुआ है! यदि वेबसाइटों को पता है कि यह कार्य स्वचालित है, तो वे तुरंत आईपी पते को ब्लॉक कर देंगी।
और इस चेक ने

को जन्म दिया है
  1. कैप्चा
  2. दर सीमित करना
  3. गतिशील सामग्री

लक्ष्य: मनुष्य कैसे काम करते हैं इसका अनुकरण करें!

उज्ज्वल डेटा कार्य को स्वचालित करता है। यहां तक ​​कि यह उपयोगकर्ता को अज्ञात बनाने के लिए आईपी को घुमाता है और उपयोगकर्ता के लिए साइटों को अनब्लॉक करता है (भुगतान किया गया संस्करण!)।

अद्भुत स्पष्टीकरण के लिए जेएसएम को धन्यवाद।
पुनश्च:
Web scraping- Interesting!
ज़ोर-ज़ोर से हंसना!

विज्ञप्ति वक्तव्य यह आलेख यहां पुन: प्रस्तुत किया गया है: https://dev.to/leg_end/web-scraping-interesting-17bn?1 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए [email protected] से संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3